Vector DB & RAG Developer

Практический курс по векторным базам данных и семантическому поиску. Вы развернёте Qdrant, Weaviate и FAISS, научитесь индексировать миллионы эмбеддингов, строить k-NN-поиск с фильтрами, объединять его с BM-25 и создавать RAG-ботов, которые отвечают на вопросы на основе ваших данных.
Начальный уровень
Часть
1 программы →
Сертификат Stepik

Чему вы научитесь

  • Пояснять, как работают эмбеддинги и к-NN-поиск
  • Разворачивать Qdrant, Weaviate и FAISS локально и в Docker
  • Загружать и хранить миллионы векторов, не теряя производительность
  • Настраивать фильтрацию и гибридный поиск (BM25 + ANN)
  • Реализовывать мультимодальный поиск (текст ↔ изображение) с CLIP
  • Строить RAG-чат-ботов, дополняющих LLM свежими фактами из базы
  • Метриками Recall@K и nDCG измерять качество выдачи
  • Автоматизировать CI/CD пайплайн для поиска с GitHub Actions
  • Оптимизировать индексы под CPU и GPU, выбирая HNSW, IVF или PQ
  • Оценивать, когда выбрать облако (Pinecone, Qdrant Cloud) vs on-prem

О курсе

Vector DB & RAG Developer — практический маршрут от «что такое эмбеддинги?» до production-чат-бота, отвечающего на вопросы из вашей корпоративной базы знаний.
За несколько недель вы:

  • развернёте Qdrant, Weaviate и FAISS локально и в Docker/Cloud;

  • создадите коллекции на миллионы векторов, подберёте правильный индекс (HNSW, IVF-PQ, ScaNN);

  • настроите гибридный поиск (BM25 + ANN) и мультимодальный поиск с CLIP;

  • подключите базу к LLM (OpenAI/GPT-4o, Mistral, Llama) и реализуете RAG-архитектуру;

  • измерите качество выдачи (Recall@K, nDCG) и построите автоматические тесты;

  • оформите CI/CD пайплайн: тесты → Docker → GitHub Actions → prod;

  • защитите проект от «векторного взрыва» (sharding, фильтры, дедупликация).

Итог — готовый репозиторий с API для семантического поиска и RAG-бот, которого можно деплоить на Render, Railway или собственный сервер.

Вы можете задать любой вопрос по курсу в телеграмм @alexey_stepik

Для кого этот курс

Для кого этот курс ML / Data-инженеры, которым нужен быстрый поиск по embeddings. Backend-разработчики, добавляющие умный поиск или чат-бота в продукт. DS/Analytics-junior — хотите прокачать портфолио проектом на LLM. Техлиды / CTO, выбирающие стек для корпоративного knowledge-base. Стартапы, где «Google-поиск по документам» и RAG-бот экономят поддержку.

Начальные требования

Запускать скрипт python main.py, ставить пакеты pip install …

Переходить между папками (cd), копировать-вставлять команды

Склонировать репозиторий git clone … — всё остальное покажем

Наши преподаватели

Как проходит обучение

  1. Недельный ритм: теория → мини-квиз → практика.

  2. Практические задания: автотесты; финальный pet-project.

  3. Ревью: код проверяют наставники, дают фидбек в рецензиях.

  4. Гибкие дедлайны: учитесь своим темпом, доступ к материалам — неограничен

Программа курса

загружаем...
Certificate

Сертификат

Сертификат Stepik

Входит в 1 программу

  •    
     
     

Что вы получаете

  • практические навыки работы с Qdrant, Weaviate и FAISS на реальных данных;
  • готовый репозиторий с RAG-ботом и REST API, который можно показать работодателю;
  • чек-листы и шпаргалки по настройке индексов, метрикам Recall@K / nDCG и деплой-pipelines;
  • доступ к закрытому Telegram-чату и еженедельным лайв-Q&A;
  • оперативную поддержку наставников в комментариях к шагам;
  • сертификат о завершении курса;
  • проект в портфолио и рекомендации, как рассказать о нём на собеседовании.

Сколько стоит обучение

Price: 5 990 
Вы попробовали и поняли, что вам сейчас не подходит этот курс? Ничего страшного, мы вернём вам деньги в течение 30-ти дней после покупки.

Часто задаваемые вопросы

Расскажите о курсе друзьям

Price: 5 990