Чему вы научитесь
- Строить конкурентно-способные и стабильные модели машинного обучения с максимальным качеством
- Понимать практические методы из статистики, полезные для машинного обучения
- Увеличивать свои шансы на победу при участии в соревнованиях по Data Science
- Реализовывать изученные техники на Python 🐍
- Писать код в 100 раз быстрее за счет генеративного AI 🤖
О курсе
Что будет на курсе? Ты узнаешь об эффективных и хорошо зарекомендовавших себя техниках построения моделей машинного обучения. Мы расскажем, как правильно генерировать и фильтровать признаки, тюнить и валидировать модели, строить ансамбли и ускорять вычисления, а также другие часто применяемые на практике вещи вплоть до вычислений в облаках.
В рамках курса будет 10 модулей, более 200 практических заданий на отработку материала, интервью с Kaggle Grand Masters, сильное комьюнити с заряженными участниками (20 из которых ужа заработали свои первые медали на Kaggle), и многое другое.
📦⚙️ Лучших студентов снаряжаем сервером с несколькими GPU и большой оперативной памятью для участия в боевых чемпионатах.
Чего не будет на курсе? Это крайне практический курс, направленный на применение ML в реальных задачах. Тут не будет рассмотрена теоретическая/математическая сторона машинного обучения. Мы не будем считать производные и писать линейные регрессии с нуля, а будем учиться использовать существующие инструменты, чтобы делать свои модели наиболее точными и эффективными. Решенную по ходу курса задачу на Kaggle, можно будет использовать в качестве портфолио для демонстрации будущим работодателям.
Для кого этот курс
Этот курс подойдет тем, кто хочет научиться выжимать максимум точности из ML моделей, применяя современные подходы, а также начать (начать чаще) выигрывать в соревнованиях по Data Science.
Начальные требования
- Умение программировать на Python 🐍
- Знание основ машинного обучения
- Опыт работы с библиотеками pandas/numpy упростит процесс прохождения курса, но не является обязательным
Наши преподаватели
Как проходит обучение
По ходу курса будут раскрываться основные техники по увеличению качества моделей машинного обучения на реальных данных. Изучая теорию, вы решите около 200 практических задач. В конце закрепите и отработаете полученные навыки в формате Kaggle-соревнования на настоящей бизнес задаче. Главный язык программирования курса - Python.
Программа курса
Сертификат
Что вы получаете
- ✅ Поймешь алгоритм построения ML решений, которые способны выиграть.
- ✅ Изучишь настройку градиентных бустингов: CatBoost, LightGBM и XGBoost.
- ✅ Закрепление теории на 200+ тестах и задачах из реальной работы Data Scientist'а
- ✅ Опыт участия в соревновании на платформе Kaggle
- ✅ Доступ к примерам решений победителей чемпионатов
- ⚙️ Доступ к мощному серверу с несколькими GPU и большой оперативной памятью для участия в боевых чемпионатах.
- ✅ Собственноручно написанный "пайплайн" для будущих соревнований
- ✅ Разберешься, как проверять гипотезы быстрее своих оппонентов.
- ✅ Получишь полноценную практику Feature Engineering'а.
- ✅ Изучишь большой набор приемов, как выжимать максимальную точность из данных и ML моделей.
- ✅ Поддержку наставников, которые отвечают в чате 24/7
- ✅ Комьюнити единомышленников для совместного участия в чемпионатах
- ✅ Проект в портфолио и уникальный материал для использования на работе
- ✅ Фирменный мерч за успехи в соревнованиях!