Чему вы научитесь

Понимать, как работают векторные представления (embeddings) и алгоритмы поиска ближайших соседей
Устанавливать и запускать Qdrant, Weaviate и FAISS в Docker, Kubernetes и облачных платформах
Генерировать эмбеддинги с помощью OpenAI, Cohere, sentence-transformers и open-source моделей
Создавать коллекции и индексировать миллионы векторов без потери скорости поиска
Выбирать оптимальные индексы: HNSW для быстрого поиска, IVF-PQ для экономии памяти, ScaNN для GPU
Настраивать фильтрацию по метаданным и комбинировать её с векторным поиском
Строить гибридный поиск: объединять семантический поиск (ANN) с классическим BM25
Реализовывать мультимодальный поиск текст↔изображение с использованием CLIP-моделей
Подключать vector database к языковым моделям (GPT-4, Claude, Llama) для RAG-архитектуры
Создавать чат-ботов, которые отвечают на вопросы на основе корпоративной базы знаний
Обрабатывать документы: chunking, извлечение текста из PDF/Word, создание эмбеддингов
Измерять качество поисковой выдачи метриками Recall@K, Precision@K, nDCG и MRR
Настраивать threshold для отсечения нерелевантных результатов и контроль галлюцинаций LLM
Оптимизировать производительность: батчинг, кеширование, асинхронные запросы
Реализовывать sharding и репликацию для горизонтального масштабирования
Строить CI/CD пайплайн: автотесты качества поиска, Docker-образы, GitHub Actions
Деплоить векторную базу и RAG-систему на production (Render, Railway, AWS, GCP)
Мониторить latency, throughput и качество выдачи в реальном времени
Защищать систему от векторного взрыва: дедупликация, TTL, лимиты на размер базы
Принимать архитектурные решения: когда выбрать облачное решение (Pinecone, Qdrant Cloud) vs самостоятельный хостинг

О курсе

RAG (Retrieval-Augmented Generation) — это технология, которая позволяет языковым моделям работать с актуальными данными и корпоративными знаниями. Вместо того чтобы полагаться только на обучающие данные, RAG-системы находят релевантную информацию в векторных базах и используют её для генерации точных ответов.

Почему именно этот курс?

Большинство курсов по AI останавливаются на базовых примерах с LangChain. Мы идём дальше — от математики эмбеддингов до продакшен-систем с мониторингом качества и CI/CD.

Что делает курс особенным:

Три векторные БД (FAISS, Qdrant, Weaviate) с глубоким погружением в архитектуру
Практикумы с реальными сценариями: от прототипа до deployment
Мультимодальный поиск (текст + изображения)
Production-подход: метрики качества, контроль версий, CI/CD для ML

Структура курса:

Введение в векторный поиск — эмбеддинги, алгоритмы ANN, архитектура хранилищ
FAISS — высокопроизводительная библиотека от Meta для миллионов векторов
Qdrant — современная векторная БД с богатым функционалом
Weaviate — векторная БД с GraphQL и гибкой схемой данных
Production-практики — мультимодальность, метрики, мониторинг, CI/CD

Каждый раздел включает практикум, где вы собираете работающие RAG-пайплайны и решаете задачи, близкие к боевым.

Для кого этот курс

ML-инженеры, которые хотят внедрять RAG в production и работать с векторными БД Backend-разработчики, интегрирующие AI/LLM в свои приложения Data Scientists, переходящие в ML Engineering и желающие понять инфраструктуру AI-энтузиасты с опытом программирования, готовые строить реальные AI-системы

Начальные требования

Python — умеете писать простые скрипты, работали с библиотеками типа pandas или requests
Базовое понимание ML — слышали про векторы и знаете, что такое расстояние между точками (остальное объясним)
Желательно, но не обязательно: опыт с API, знакомство с Git, общее представление о том, как работают LLM

Если вы писали код на Python и интересуетесь AI — этого достаточно. Всю специфику RAG и векторных БД разберём с нуля.

Наши преподаватели

Как проходит обучение

Курс построен по принципу «от теории к практике»:

Текстовые лекции — разбор архитектуры, алгоритмов и best practices
Практические задания — код на Python с автоматической проверкой
Практикумы — сквозные задачи по построению RAG-систем на каждой векторной БД
Тесты — проверка усвоения ключевых концепций
Поддержка — обратная связь от преподавателя и комьюнити курса

Формат: изучаете материал в своём темпе, выполняете задания с проверкой, получаете обратную связь. Проектная работа — полноценный RAG-пайплайн с выбранной векторной БД.

Программа курса

загружаем...

Что вы получаете

Навыки проектирования RAG-архитектур под разные бизнес-задачи
Практический опыт с тремя векторными БД: FAISS, Qdrant, Weaviate
Умение оценивать качество поиска и настраивать метрики для production
Знание production-практик: мультимодальный поиск, пороги уверенности, мониторинг
Опыт развёртывания ML-систем с CI/CD через GitHub Actions
Портфолио проектов с рабочими RAG-системами
Сертификат о прохождении курса
Доступ к форуму с единомышленниками и поддержкой наставников

Сколько стоит обучение

Часто задаваемые вопросы

Как оплатить курс в рассрочку?

Как оплатить от компании?

Расскажите о курсе друзьям

Прямая ссылка на курс:
https://stepik.org/278919

RAG-системы на векторных базах данных