Чему вы научитесь
- Понимать базовые концепции машинного обучения
- Применять линейную регрессию для предсказания
- Использовать логистическую регрессию для классификации
- Строить модели методом K-ближайших соседей
- Применять метод опорных векторов (SVM) для классификации
- Обрабатывать и заполнять пропущенные значения в данных
- Понимать и применять методы регуляризации
- Оптимизировать модели через минимизацию функции потерь
- Использовать случайный лес для предсказаний
- Обучать модели градиентного бустинга
- Применять методы уменьшения размерности данных
- Проводить тестирование моделей
- Понимать и использовать ансамблевые методы
- Оценивать модели по качеству работы
О курсе
Машинное обучение — это направление, которое позволяет создавать алгоритмы, способные учиться на данных и решать с их помощью разнообразные задачи. Это могут быть задачи классификации изображений, предсказание числовых значений, анализ текста, автоматизация принятия решений и многие другие. Эти технологии активно внедряются в различных сферах, начиная от финансового анализа и заканчивая медициной и разработкой автономных транспортных средств.
И да, ЧатГПТ это тоже машинное обучение. Только очень крутое и страшное)
В этом курсе вы познакомитесь с основными концепциями машинного обучения, научитесь работать с различными алгоритмами, такими как линейная регрессия, логистическая регрессия, случайные леса и градиентный бустинг. Вы также узнаете, как обрабатывать и анализировать данные, оценивать качество моделей и улучшать их с помощью методов регуляризации и уменьшения размерности. Все эти темы будут рассмотрены не только в теории, но и на практике, с применением современных библиотек машинного обучения, применяемых в индустрии, чтобы Вы могли закрепить свои знания на реальных задачах.
Курс полностью текстовый, без видеоуроков. Всё изложено системно и по делу, чтобы Вы могли усваивать материал в удобном для Вас темпе.
Помимо теории, мы на практике затронем следующий стэк:
-
scikit-learn — это библиотека, с которой начинают изучение машинного обучения. В ней собраны простые, но мощные инструменты, которые помогают решать задачи вроде "определить, уйдёт ли клиент", "распознать спам" или "предсказать цену квартиры". Её используют в банках, маркетинге, здравоохранении и логистике — везде, где нужно анализировать таблицы с данными и делать прогнозы. Мы изучаем её, чтобы освоить базовые приёмы работы с данными и моделями.
-
XGBoost, CatBoost и LightGBM — это более мощные инструменты, которые используют, когда нужно получить максимально точный результат. Эти библиотеки применяют в реальных проектах Яндекс, Сбербанк, Amazon, Netflix и других крупных компаниях. С их помощью можно, например, рекомендовать товары, выявлять мошенничество по транзакциям, улучшать рекламу, прогнозировать спрос. Мы учим их, потому что это рабочие инструменты, которые дают результат в задачах бизнеса.
Для кого этот курс
Начальные требования
Знание Python
Знание школьного математического анализа
Рекомендуется, но не обязательно знание библиотеки pandas
Изучение pandas: https://stepik.org/course/213523/
Наши преподаватели
Как проходит обучение
Онлайн формат: Вы получаете доступ к урокам в удобное для вас время, что позволяет учиться в собственном темпе.
Тесты: Для самопроверки предусмотрены тесты, которые позволят оценить ваше понимание теоретического материала.
Автоматические проверки: Выполняя задания, вы сразу увидите результат работы и сможете проверить свои ответы.
Программа курса
Сертификат
Входит в 1 программу
Что вы получаете
- Диплом
- Практические навыки построения, оптимизации и оценки моделей машинного обучения.
- Умение использовать библиотеки Scikit-learn, XGBoost, LightGBM, CatBoost.
- Знания, необходимые для работы с реальными данными и их подготовки.