Чему вы научитесь
- Разберетесь в архитектуре трансформеров
- Узнаете про большие языковые модели
- Научитесь дообучать LLM под свои задачи
- Разберетесь с техниками эффективного дообучения LLM
- Узнаете как делать инференс LLM
- Освоите технологию RAG и научитесь создавать AI-агентов
О курсе
Курс посвящен очень популярной сегодня теме - большим языковым моделям (Large Language Models или LLM). Действительно, современные чат-боты на базе LLM (ChatGPT, Gemini, Gigachat, DeepSeek, YandexGPT и другие) впечатляют нас своими ответами, и многие уже на повседневной основе пользуются этими помощниками.
В курсе мы погрузимся в то, как работают большие языковые модели - в теории и на практике. Но LLM - не единственное достижение в области обработки естественного языка (Natural Language Processing или NLP), поэтому в первой части курса мы вспомним (а кто-то - познакомится) и другие рабочие подходы и инструменты для решения NLP-задач, а потом уже перейдем непосредственно к LLM.
Кроме того, знать как работают LLM и обучать/дообучать их в Python - недостаточно. Важно и полезно уметь доводить свои эксперименты до готового продукта и реализовывать сервисы и боты для инференса своих решений - про это и многое другое мы также поговорим на курсе.
Для кого этот курс
Начальные требования
Знание классического Machine Learning
Знание основных подходов и базовых архитектур Deep Learning
Опыт обучения моделей в Python
Наши преподаватели
Как проходит обучение
Обучение происходит на платформе Stepik: слушатели изучают материалы в текстовом формате, смотрят видео-скринкасты с практическими примерами, проходят тесты и выполняют практические домашние задания.