Чему вы научитесь
- Из первых трех блоков вы научитесь:
- 1. Совмещать нейронные сети и градиентные бустинги для классификации документов
- 2. Оптимизировать параметры градиентного бустинга в нетривиальных сценариях
- 3. Моделировать временные ряды и работать с временными зависимостями.
- 4. Научитесь классифицировать документы и картинки.
- Следующие 3 блока будут для вас сюрпризом!
О курсе
6 насыщенных блоков с теорией и практикой от наших экспертов индустрии!
1. Градиентные бустинги.
Разберём особенности CatBoost, LightGBM и XGBoost, научимся оптимизировать параметры и даже реализуем бустинг с нуля!
2. Последовательные данные: работа со временем в моделях.
В этом блоке вы узнаете, как моделировать временные ряды и работать с временными зависимостями.
3. Self-supervised learning: использование векторных представлений из нейронных сетей для мультимодальных данных.
В домашних заданиях по этой теме вы будете тренироваться классифицировать документы и картинки.
А ещё…сюрпризы в последующих ТРЕХ блоках! 🤫
🗣️ Преподавать будут лучшие спикеры из топовых технологических компаний и ведущих научных центров: Яндекс, Сбер, Huawei, Skoltech.
Для кого этот курс
Начальные требования
Для комфортного прохождения курса желательно:
🔸 Знание базового классического ML — например, вы понимаете, что такое случайный лес.
🔸 Основы линейной алгебры.
🔸 Основы теории вероятностей.
🔸 Навыки программирования на Python и умение пользоваться библиотеками pandas, scikit-learn и numpy.
Наши преподаватели
Как проходит обучение
Курс включает как теоретические материалы, так и практические задания. Для автоматической проверки практики мы подготовили специальную систему, о которой расскажем внутри курса.
Обучение будет проходить в онлайн-формате.
⏳Дедлайнов нет — вы можете проходить курс в комфортном для себя темпе.
Программа курса
Что вы получаете
- В первом блоке вы досконально освоите идею бустинга на действительно углубленном уровне - от математики фридмана до современных подходов.
- Также вы научитесь ускорять обучение моделей на GPU и узнаете методы борьбы с переобучением и шумом в данных.