Чему вы научитесь
- Формулировать ML-задачу из бизнес-требований: выбирать таргет, тип задачи, метрики и trade-offs.
- Проводить EDA, находить аномалии, пропуски, data leakage и временные утечки.
- Строить и валидировать признаки: кодирование, нормализация, обработка пропусков, feature selection и feature pipeline.
- Обучать baseline- и gradient boosting-модели, выбирать схему валидации и корректно интерпретировать результаты.
- Организовывать experiment tracking, сравнивать эксперименты и выбирать модель-кандидат на продакшн.
- Проводить error analysis: confusion matrix, сегментация ошибок, анализ сложных примеров и планирование следующих итераций.
- Упаковывать модель и признаки для inference, проектировать API-контракт и собирать сервис предсказаний на FastAPI.
- Встраивать ML-проект в инженерный контур: тесты, CI/CD, сборка артефактов и релизные проверки качества.
- Настраивать мониторинг latency, ошибок, data drift, prediction drift и деградации модели после релиза.
- Объяснять результаты, ограничения и trade-offs модели бизнесу, продукту и инженерной команде.
О курсе
Этот курс посвящён полному прикладному циклу Data Science: от постановки ML-задачи и анализа данных до сервиса предсказаний, CI/CD и мониторинга модели в продакшне.
Вместо абстрактного “обучили модель в ноутбуке и пошли дальше” Вы пройдёте весь рабочий контур, который нужен в реальных проектах: формализация задачи, выбор метрик, проверка качества данных, поиск утечек, построение признаков, обучение baseline- и gradient boosting-моделей, experiment tracking, оценка качества, error analysis, model serving, автоматические проверки и мониторинг после релиза.
В курсе отдельно разобраны важные практические темы, которые часто упускают в классических ML-курсах: reproducibility, data leakage, стабильность признаков, ложное улучшение качества, API-контракт для inference, batch-inference, тестирование data pipeline и inference API, quality gates перед деплоем, data drift и prediction drift.
Курс подойдёт тем, кто хочет не просто запускать модели, а понимать, как довести ML-решение до рабочего продакшн-сценария: с воспроизводимостью, валидацией, сервисом предсказаний, мониторингом и понятной коммуникацией результатов.
Программа курса включает:
— постановку ML-задачи и работу с данными;
— feature engineering и подготовку признаков;
— обучение и валидацию моделей;
— experiment tracking и оценку качества;
— error analysis и итеративное улучшение;
— подготовку модели к деплою;
— CI/CD для ML-проектов;
— мониторинг и поддержку моделей в продакшне;
— коммуникацию результатов и ограничений модели.
Для кого этот курс
Начальные требования
Для комфортного прохождения курса желательно:
— уверенно писать на Python;
— уметь работать с Jupyter Notebook;
— знать основы pandas и NumPy;
Курс не рассчитан на полный старт с нуля в Python и математике. Если Вы уже умеете работать с данными и знакомы с базовым ML, курс поможет перейти к более прикладному и production-oriented уровню.
Наши преподаватели
Как проходит обучение
Обучение построено как последовательный проход по полному циклу Data Science-проекта.
Внутри курса Вас ждут теоретические объяснения, практические примеры и задания, в которых нужно будет формулировать ML-задачу, анализировать данные, строить признаки, обучать и оценивать модели, разбирать ошибки, собирать inference API, добавлять тесты, настраивать CI/CD и мониторинг.
По мере прохождения курса Вы будете двигаться от постановки задачи и EDA к обучению модели, затем к деплою, проверкам качества и поддержке модели после релиза. Такой формат помогает увидеть Data Science не как набор разрозненных техник, а как цельный инженерный процесс.
Программа курса
Что вы получаете
- Полный прикладной пайплайн Data Science: от постановки ML-задачи и работы с данными до inference API, CI/CD и мониторинга модели в продакшне.
- Практические навыки, которые редко собирают в одном курсе: data leakage, feature engineering, experiment tracking, error analysis, quality gates, data drift и prediction drift.
- Понимание того, как доводить ML-решение до рабочего продакшн-сценария, а не оставлять его на уровне ноутбука.
- Практику на реальных для индустрии сценариях: обучение моделей, анализ ошибок, упаковка сервиса предсказаний, автоматические проверки и мониторинг после релиза.
- Системное представление о работе дата-сайентиста в реальном проекте: метрики, trade-offs, SLA, ограничения модели и взаимодействие с бизнесом и инженерами.
- Навыки, которые можно использовать в работе, pet-проектах и портфолио.