Чему вы научитесь
- Описывать модели схему своей базы (таблицы, типы, ключи, словарь бизнес-терминов), чтобы SQL попадал в реальную структуру, а не в выдуманную
- Превращать вопрос на русском в рабочий SQL через LLM-API для PostgreSQL и SQLite — с JOIN, агрегатами, оконными функциями и фильтрами по периодам
- Ловить галлюцинации модели до отчёта: статическая проверка колонок, EXPLAIN и dry-run, контрольные суммы, отлов подмены INNER/LEFT JOIN и перепутанных единиц
- Ставить guardrails и петлю самокоррекции: блокировать DML, чинить ошибочный запрос автоматически
- Собирать конвейер «вопрос → SQL → проверка → pandas → отчёт» на Python, который выдаёт проверенную таблицу с автокомментарием по цифрам
- Строить дашборды и нарративные отчёты на продажах, выручке и котировках MOEX — от запроса до графика и текстового вывода
- Работать с боевыми данными безопасно: передавать модели только схему, держать данные локально, ставить read-only доступ, логи запросов и контроль бюджета
- Упаковывать собственного ИИ-ассистента аналитика в проект для GitHub: README, демо, метрика качества, строчка в резюме
О курсе
Большинство SQL-курсов учат писать запросы. Этот — учит заставить LLM писать их за вас и ловить, когда она врёт. Если SQL и отчётность — ваша ежедневная работа, вы знаете цену рутине: двадцатую вариацию «выручка по сегментам за квартал с фильтром по региону» приходится собирать руками каждый раз. Хочется продиктовать задачу на русском и получить готовый запрос. Но как только цифра из такого запроса уходит в слайд руководству, появляется второй, главный страх: модель уверенно придумывает колонку revenue_total вместо amount, тихо меняет INNER JOIN на LEFT и раздувает сумму втрое. Запрос при этом выполняется без единой ошибки — он не «упал», он просто врёт.
Причина не в «глупости» модели: ChatGPT в браузере пишет SQL «вообще», он не видит ваши таблицы, ключи и единицы. Решение — не «промпт получше», а инженерный слой вокруг модели: передать ей точную схему вашей базы, а сгенерированный SQL прогнать через проверки до того, как он коснётся отчёта. Этот курс разбирает text-to-SQL как пайплайн с контролем качества, а не как «спросить ИИ и скопировать ответ». Не «генерация SQL по кнопке», а три отдельных навыка: передать модели схему и словарь терминов, поймать галлюцinацию на тестовой выборке и объяснить безопаснику, что именно уходит в облако, а что нет.
Ядро курса — анти-галлюцinационный слой. Вы разберёте каталог типовых ошибок text-to-SQL на учебной базе и научитесь ловить каждую: статическая проверка (существуют ли таблицы и колонки, парсится ли SQL), проверка на данных (EXPLAIN, dry-run, контрольные суммы вроде COUNT(*) и сверка сумм), отлов подменённого JOIN и перепутанных единиц через сверку с эталоном, плюс guardrails и петля самокоррекции. Это то, что отличает рабочий ассистент от «ChatGPT, напиши SQL» — и то, что делает результат пригодным для боевых данных.
Внутри: 8 модулей, 30 уроков, ~289 проверяемых шагов. Главный плюс формата — sqlite3 входит в стандартную библиотеку Python, поэтому реальный SQL по учебной базе, проверка колонок, парсинг запросов и контрольные суммы запускаются прямо в Stepik, а не «на словах». Реальные вызовы LLM-API (Claude, OpenAI), боевой PostgreSQL через psycopg2, графики и локальные модели (Ollama) выносятся в Google Colab с пошаговой инструкцией — вы собираете решение сами в Google Colab, а не открываете готовую заготовку. Практикуете на узнаваемых данных: таблицы продаж и выручки (orders, order_items, products, customers) и котировки MOEX — SBER, LKOH, GAZP. Финал — капстоун: вы собираете собственного ИИ-ассистента аналитика, прогоняете его на своей базе с мини-eval (цель — pass rate ≥ 0.8 на контрольных вопросах) и упаковываете в проект для GitHub с README и демо.
Сквозной пример курса — ассистент sql-аналитик над учебной базой shop.db, который от модуля к модулю обрастает слоями: знание схемы, генерация SQL, слой проверок, конвейер до отчёта, дашборд и безопасный режим для боевых данных. Реалистичный сценарий: с выдуманными колонками, подменёнными JOIN, перепутанными рублями и копейками, требованием не выгружать клиентскую базу в чужую модель и вопросом безопасника «что именно уходит в облако». Такой же запрос, с каким вы столкнётесь на следующей неделе на своих данных.
Для кого этот курс
Начальные требования
Честно, чтобы вы не разочаровались на третьем уроке:
- SQL — базовый уровень. Вы пишете
SELECTсJOINиGROUP BYи понимаете, как выглядит правильный результат. Мы не объясняем SQL с нуля — мы учим заставить модель писать его и проверять за ней. - Python и pandas — базовый уровень. Достаточно уметь написать функцию и выгрузить данные в DataFrame. Если Python совсем новый — у автора есть бесплатный вводный курс, ссылка дана в первом уроке.
- LLM — с нуля. Промпт, контекст, температура, токены, галлюцинация, few-shot — всё вводится по ходу, опыта работы с моделями не требуется.
- Доступ к LLM-API (Claude или OpenAI) для практики в Colab. Задания внутри Stepik работают без него — на замороженных ответах модели и реальном
sqlite3.
Наши преподаватели
Как проходит обучение
Курс построен как рабочая консультация старшего аналитика, который сам набил шишки на галлюцинациях модели, — без хайпа про «революцию ИИ» и с оговоркой, где модель ломается. Каждый урок — короткая теория и сразу практика: SQL-задачи и код на чистом Python проверяются автотестами прямо в Stepik (спасибо sqlite3 из стандартной библиотеки), а тяжёлая часть — реальные вызовы API, PostgreSQL, графики, локальные модели — идёт в Google Colab по пошаговой инструкции — собираете всё сами в Google Colab, без готовой заготовки. Задания — не пустышки: дистракторы взяты из настоящих ошибок модели (придуманная колонка, подменённый JOIN, перепутанные единицы), а каждый модуль наращивает один слой сквозного ассистента, который вы соберёте целиком в капстоуне.
Программа курса
Что вы получаете
- Рабочий ИИ-ассистент аналитика — Python-скрипты + промпты + слой проверок, который можно направить на свою базу и использовать в работе.
- Функции извлечения схемы (sqlite_master, PRAGMA, information_schema) и сборки словаря данных, которые делают промпт всегда актуальным под вашу структуру.
- Слой анти-галлюцinационных проверок: статическая проверка колонок, EXPLAIN и dry-run, контрольные суммы, отлов подмены JOIN и единиц, guardrails и петля самокоррекции.
- Готовый конвейер «вопрос → SQL → проверка → pandas → отчёт» с автокомментарием по цифрам и повторяемыми параметризованными отчётами.
- Дашборды и нарративные отчёты на продажах, выручке и котировках MOEX — от запроса до графика и текстового вывода.
- Безопасный режим для боевых данных: передача только схемы, локальные модели, read-only доступ, журнал запросов и контроль бюджета.
- Капстоун-проект для портфолио — собственный ассистент на GitHub с README, демо-GIF, метрикой pass rate и готовой строчкой в резюме и для собеседования.