Computer Vision Engineer: от детекции и Doc-AI до продакшна

Практический курс по Computer Vision. Соберёте продакшн-сервис: датасет → обучение (YOLO/RT-DETR, SAM), трекинг, OCR/Doc-AI, веб-приложение (UI+API) и мониторинг. Экспорт в ONNX/TensorRT/OpenVINO, батчинг/квантование под CPU/GPU. Плюс профессиональные блоки: mAP/IoU/Dice и калибровка доверия, QA разметки и…
Средний уровень
Сертификат Stepik

Чему вы научитесь

  • Проектировать end-to-end пайплайн CV: сбор данных → разметка → обучение → инференс → деплой → мониторинг
  • Строить детекторы на YOLOv8/YOLO11 и RT-DETR, подбирать якоря/размеры, управлять NMS/конфиденсом
  • Применять SAM/Segment-Anything и fine-tune для продакшн-сегментации (binary/multiclass/instance)
  • Настраивать OCR/Doc-AI: PaddleOCR + LayoutParser/Detectron2 → извлечение полей → JSON → БД
  • Готовить датасеты: Label Studio/Roboflow, схемы классов, сплиты по сюжетам/камерам, стратификация
  • Проводить валидацию датасета: дубликаты, перекос классов, выбросы, «утечка» между train/val/test
  • Делать аугментации/синтетику (Albumentations, фоновые замены, RandAugment, Copy-Paste) для повышения mAP/IoU
  • Запускать обучение по рецептам: косинусный шедулер, EMA, заморозка бэкбона, mixed precision
  • Оценивать качество: mAP@[.5:.95], IoU/Dice, precision/recall, PR-кривые, калибровка вероятностей
  • Проводить error analysis: confusion-матрицы, per-class/per-area метрики, hard-examples, TTA
  • Оптимизировать инференс: экспорт в ONNX/TensorRT/OpenVINO, INT8 квантизация, fusion, dynamic shapes
  • Управлять производительностью: батчинг, пайплайн pre/post-processing, ограничение копий модели, warm-up
  • Строить сервис: FastAPI эндпоинты (sync/async), очереди Redis/RabbitMQ, rate-limit, ретраи, тайм-ауты
  • Собирать наблюдаемость: Prometheus метрики (p50/p95 latency, throughput, GPU/CPU/VRAM), структурированные логи
  • Настраивать алерты и дашборды (Grafana), считать cost/req и cost/1000 кадров
  • Выявлять дрейф данных/качества: pop-stats по фичам, PSI, мониторинг классов/размеров объектов
  • Деплоить в Docker/Compose; делать канареечные и блю-грин релизы, shadow-traffic, rollbacks
  • Организовывать CI/CD: линтеры, тесты инференса, проверка весов/версий, автосборки образов
  • Обеспечивать приватность и безопасность: маскирование лиц/номеров, PII-политики, аудит доступа
  • Документировать сервис (OpenAPI), готовить отчёты по метрикам для бизнеса и ROMI-скелеты
  • Оформлять проекты в портфолио: репозиторий с Makefile/README, скрипты во

О курсе

Этот курс — про продакшн-компьютерное зрение. Вы пройдёте путь от данных и разметки до работающего сервиса с метриками качества, скорости и стоимости инференса. Мы не ограничиваемся ноутбуками: строим сервисы, считаем p95-латентность и cost/1000 кадров, настраиваем мониторинг и приватность.

Что внутри. Детекция и сегментация (YOLOv8/YOLO11, RT-DETR, SAM), Doc-AI (PaddleOCR + LayoutParser), экспорт и ускорение (ONNX/TensorRT/OpenVINO, квантизация INT8, батчинг, динамические инпуты), сервисный слой (FastAPI, очереди Redis/RabbitMQ, rate-limit, ретраи), деплой (Docker/Compose, канареечные релизы), наблюдаемость (Prometheus/Grafana, структурированные логи, алерты).

Практика и артефакты.

  • Retail: детектор пустых полок → mAP, p95, cost/req, дашборд.

  • Пром: сегментация дефектов → IoU/Dice, отчёт по браку для менеджмента.

  • Офис: Doc-AI для чеков/актов → JSON → БД, SLA эндпоинта.
    Каждый модуль завершается артефактом: модель/скрипт инференса/эндпоинт/отчёт или дашборд. Все репозитории воспроизводимы (Makefile, docker-compose, инструкции «из коробки»).

Почему это ценно. Вы научитесь не только обучать модели, но и обосновывать ROMI: корректно мерить качество, latency и стоимость, находить узкие места, безопасно обновлять модели (канарейка/shadow), соблюдать политику PII (маскирование лиц/номеров, аудит доступа).

Формат: короткая теория → код → автопроверки/чек-листы → мини-итог. Финал — деплой сервиса с мониторингом и отчётом метрик.

Для кого этот курс

Python-разработчики и интеграторы CCTV/ритейл/склад/пром, кому нужен измеримый бизнес-результат (качество + p95 + стоимость). Data/ML-специалисты, которые хотят довести CV-модель до продакшн-сервиса с мониторингом и алертами. Фрилансеры/аутсорс-команды, собирающие портфолио под SMB-задачи (детекция, сегментация, документы). Техлиды пилотов PoC → Prod, кому важны reproducibility, CI/CD и безопасные релизы.

Начальные требования

Обязательные:

  • Уверенный Python, Linux/Docker на базовом уровне, git, терминал.

  • Готовность следовать инструкциям по воспроизводимым окружениям (Makefile, docker-compose).

Желательно:

  • Базовый PyTorch или опыт с любым DL-фреймворком.

  • Понимание ML-метрик (precision/recall, mAP, IoU/Dice).

Наши преподаватели

Как проходит обучение

  • Каждая неделя — мини-спринт: короткая теория → примеры кода → практикум → автопроверка.

  • Практика — по готовым рабочим шаблонам: тренировка → экспорт в ONNX/OpenVINO → FastAPI-эндпоинт → метрики Prometheus. Для каждого задания есть репозиторий, инструкции make/docker-compose и эталон ожидаемых метрик.

  • Автопроверка практики: юнит-тесты инференса, проверка формата вывода/скорости, чтение /metrics (p95 latency) и контроль cost/req.

  • Данные: даём демо-датасет + чек-лист валидации для своих данных (Label Studio/Roboflow).

  • Мониторинг прогресса: после каждого спринта — отчёт метрик (качество/latency/стоимость) и чек-лист.

  • Финал — задеплоенный сервис (Docker) с дашбордом Grafana и отчётом по метрикам.

Программа курса

загружаем...
Certificate

Сертификат

Сертификат Stepik

Что вы получаете

  • 3 проекта-витрины (retail/defects/doc-ai) с отчётами метрик (mAP/IoU/Dice, p95, cost/req).
  • Код-скелеты: тренировка, инференс, экспорт в ONNX, FastAPI-endpoint, Dockerfile, docker-compose.
  • Шаблоны наблюдаемости: Prometheus экспортер, Grafana дашборд.
  • Валидатор датасета и чек-листы качества/скорости/стоимости.
  • CPU-трек (ONNX/OpenVINO, INT8 квантизация) — если без GPU.
  • ROMI-скелет для SMB-кейсов (как считать cost/req и обосновывать выгоду).
  • Портфолио: 3 публичных репозитория с Makefile/README и инструкциями воспроизведения.

Сколько стоит обучение

Price: 19 990 
Вы попробовали и поняли, что вам сейчас не подходит этот курс? Ничего страшного, мы вернём вам деньги в течение 30-ти дней после покупки.

Часто задаваемые вопросы

Расскажите о курсе друзьям

Price: 19 990