Чему вы научитесь
- Понимать, как работают векторные представления (embeddings) и алгоритмы поиска ближайших соседей
- Устанавливать и запускать Qdrant, Weaviate и FAISS в Docker, Kubernetes и облачных платформах
- Генерировать эмбеддинги с помощью OpenAI, Cohere, sentence-transformers и open-source моделей
- Создавать коллекции и индексировать миллионы векторов без потери скорости поиска
- Выбирать оптимальные индексы: HNSW для быстрого поиска, IVF-PQ для экономии памяти, ScaNN для GPU
- Настраивать фильтрацию по метаданным и комбинировать её с векторным поиском
- Строить гибридный поиск: объединять семантический поиск (ANN) с классическим BM25
- Реализовывать мультимодальный поиск текст↔изображение с использованием CLIP-моделей
- Подключать vector database к языковым моделям (GPT-4, Claude, Llama) для RAG-архитектуры
- Создавать чат-ботов, которые отвечают на вопросы на основе корпоративной базы знаний
- Обрабатывать документы: chunking, извлечение текста из PDF/Word, создание эмбеддингов
- Измерять качество поисковой выдачи метриками Recall@K, Precision@K, nDCG и MRR
- Настраивать threshold для отсечения нерелевантных результатов и контроль галлюцинаций LLM
- Оптимизировать производительность: батчинг, кеширование, асинхронные запросы
- Реализовывать sharding и репликацию для горизонтального масштабирования
- Строить CI/CD пайплайн: автотесты качества поиска, Docker-образы, GitHub Actions
- Деплоить векторную базу и RAG-систему на production (Render, Railway, AWS, GCP)
- Мониторить latency, throughput и качество выдачи в реальном времени
- Защищать систему от векторного взрыва: дедупликация, TTL, лимиты на размер базы
- Принимать архитектурные решения: когда выбрать облачное решение (Pinecone, Qdrant Cloud) vs самостоятельный хостинг
О курсе
RAG (Retrieval-Augmented Generation) — это технология, которая позволяет языковым моделям работать с актуальными данными и корпоративными знаниями. Вместо того чтобы полагаться только на обучающие данные, RAG-системы находят релевантную информацию в векторных базах и используют её для генерации точных ответов.
Почему именно этот курс?
Большинство курсов по AI останавливаются на базовых примерах с LangChain. Мы идём дальше — от математики эмбеддингов до продакшен-систем с мониторингом качества и CI/CD.
Что делает курс особенным:
- Три векторные БД (FAISS, Qdrant, Weaviate) с глубоким погружением в архитектуру
- Практикумы с реальными сценариями: от прототипа до deployment
- Мультимодальный поиск (текст + изображения)
- Production-подход: метрики качества, контроль версий, CI/CD для ML
Структура курса:
- Введение в векторный поиск — эмбеддинги, алгоритмы ANN, архитектура хранилищ
- FAISS — высокопроизводительная библиотека от Meta для миллионов векторов
- Qdrant — современная векторная БД с богатым функционалом
- Weaviate — векторная БД с GraphQL и гибкой схемой данных
- Production-практики — мультимодальность, метрики, мониторинг, CI/CD
Каждый раздел включает практикум, где вы собираете работающие RAG-пайплайны и решаете задачи, близкие к боевым.
Для кого этот курс
Начальные требования
- Python — умеете писать простые скрипты, работали с библиотеками типа pandas или requests
- Базовое понимание ML — слышали про векторы и знаете, что такое расстояние между точками (остальное объясним)
- Желательно, но не обязательно: опыт с API, знакомство с Git, общее представление о том, как работают LLM
Если вы писали код на Python и интересуетесь AI — этого достаточно. Всю специфику RAG и векторных БД разберём с нуля.
Наши преподаватели
Как проходит обучение
Курс построен по принципу «от теории к практике»:
- Текстовые лекции — разбор архитектуры, алгоритмов и best practices
- Практические задания — код на Python с автоматической проверкой
- Практикумы — сквозные задачи по построению RAG-систем на каждой векторной БД
- Тесты — проверка усвоения ключевых концепций
- Поддержка — обратная связь от преподавателя и комьюнити курса
Формат: изучаете материал в своём темпе, выполняете задания с проверкой, получаете обратную связь. Проектная работа — полноценный RAG-пайплайн с выбранной векторной БД.
Программа курса
Что вы получаете
- Навыки проектирования RAG-архитектур под разные бизнес-задачи
- Практический опыт с тремя векторными БД: FAISS, Qdrant, Weaviate
- Умение оценивать качество поиска и настраивать метрики для production
- Знание production-практик: мультимодальный поиск, пороги уверенности, мониторинг
- Опыт развёртывания ML-систем с CI/CD через GitHub Actions
- Портфолио проектов с рабочими RAG-системами
- Сертификат о прохождении курса
- Доступ к форуму с единомышленниками и поддержкой наставников