Чему вы научитесь

Описывать модели схему своей базы (таблицы, типы, ключи, словарь бизнес-терминов), чтобы SQL попадал в реальную структуру, а не в выдуманную
Превращать вопрос на русском в рабочий SQL через LLM-API для PostgreSQL и SQLite — с JOIN, агрегатами, оконными функциями и фильтрами по периодам
Ловить галлюцинации модели до отчёта: статическая проверка колонок, EXPLAIN и dry-run, контрольные суммы, отлов подмены INNER/LEFT JOIN и перепутанных единиц
Ставить guardrails и петлю самокоррекции: блокировать DML, чинить ошибочный запрос автоматически
Собирать конвейер «вопрос → SQL → проверка → pandas → отчёт» на Python, который выдаёт проверенную таблицу с автокомментарием по цифрам
Строить дашборды и нарративные отчёты на продажах, выручке и котировках MOEX — от запроса до графика и текстового вывода
Работать с боевыми данными безопасно: передавать модели только схему, держать данные локально, ставить read-only доступ, логи запросов и контроль бюджета
Упаковывать собственного ИИ-ассистента аналитика в проект для GitHub: README, демо, метрика качества, строчка в резюме

О курсе

Большинство SQL-курсов учат писать запросы. Этот — учит заставить LLM писать их за вас и ловить, когда она врёт. Если SQL и отчётность — ваша ежедневная работа, вы знаете цену рутине: двадцатую вариацию «выручка по сегментам за квартал с фильтром по региону» приходится собирать руками каждый раз. Хочется продиктовать задачу на русском и получить готовый запрос. Но как только цифра из такого запроса уходит в слайд руководству, появляется второй, главный страх: модель уверенно придумывает колонку revenue_total вместо amount, тихо меняет INNER JOIN на LEFT и раздувает сумму втрое. Запрос при этом выполняется без единой ошибки — он не «упал», он просто врёт.

Причина не в «глупости» модели: ChatGPT в браузере пишет SQL «вообще», он не видит ваши таблицы, ключи и единицы. Решение — не «промпт получше», а инженерный слой вокруг модели: передать ей точную схему вашей базы, а сгенерированный SQL прогнать через проверки до того, как он коснётся отчёта. Этот курс разбирает text-to-SQL как пайплайн с контролем качества, а не как «спросить ИИ и скопировать ответ». Не «генерация SQL по кнопке», а три отдельных навыка: передать модели схему и словарь терминов, поймать галлюцinацию на тестовой выборке и объяснить безопаснику, что именно уходит в облако, а что нет.

Ядро курса — анти-галлюцinационный слой. Вы разберёте каталог типовых ошибок text-to-SQL на учебной базе и научитесь ловить каждую: статическая проверка (существуют ли таблицы и колонки, парсится ли SQL), проверка на данных (EXPLAIN, dry-run, контрольные суммы вроде COUNT(*) и сверка сумм), отлов подменённого JOIN и перепутанных единиц через сверку с эталоном, плюс guardrails и петля самокоррекции. Это то, что отличает рабочий ассистент от «ChatGPT, напиши SQL» — и то, что делает результат пригодным для боевых данных.

Внутри: 8 модулей, 30 уроков, ~289 проверяемых шагов. Главный плюс формата — sqlite3 входит в стандартную библиотеку Python, поэтому реальный SQL по учебной базе, проверка колонок, парсинг запросов и контрольные суммы запускаются прямо в Stepik, а не «на словах». Реальные вызовы LLM-API (Claude, OpenAI), боевой PostgreSQL через psycopg2, графики и локальные модели (Ollama) выносятся в Google Colab с пошаговой инструкцией — вы собираете решение сами в Google Colab, а не открываете готовую заготовку. Практикуете на узнаваемых данных: таблицы продаж и выручки (orders, order_items, products, customers) и котировки MOEX — SBER, LKOH, GAZP. Финал — капстоун: вы собираете собственного ИИ-ассистента аналитика, прогоняете его на своей базе с мини-eval (цель — pass rate ≥ 0.8 на контрольных вопросах) и упаковываете в проект для GitHub с README и демо.

Сквозной пример курса — ассистент sql-аналитик над учебной базой shop.db, который от модуля к модулю обрастает слоями: знание схемы, генерация SQL, слой проверок, конвейер до отчёта, дашборд и безопасный режим для боевых данных. Реалистичный сценарий: с выдуманными колонками, подменёнными JOIN, перепутанными рублями и копейками, требованием не выгружать клиентскую базу в чужую модель и вопросом безопасника «что именно уходит в облако». Такой же запрос, с каким вы столкнётесь на следующей неделе на своих данных.

Для кого этот курс

Аналитики данных и продуктовые аналитики, которые пишут SELECT с JOIN и оконными функциями и хотят диктовать рутинные запросы на русском, а не собирать двадцатую вариацию руками. Финансовые аналитики, уже знакомые с Python и pandas (например, по фин-треку автора), для кого SQL и базы данных новее, чем Excel, — работа с выручкой, P&L, продажами и котировками. BI-специалисты и аналитики отчётности, у которых десятки готовых запросов, и чья боль не «как написать SQL», а «как не перепроверять руками каждую цифру, которую выдала модель». Все, кто уже умеет считать данные руками и знает, как выглядит правильный ответ, хочет ускориться через ИИ, но не готов отправлять неверные числа в отчёт руководству.

Начальные требования

Честно, чтобы вы не разочаровались на третьем уроке:

SQL — базовый уровень. Вы пишете SELECT с JOIN и GROUP BY и понимаете, как выглядит правильный результат. Мы не объясняем SQL с нуля — мы учим заставить модель писать его и проверять за ней.
Python и pandas — базовый уровень. Достаточно уметь написать функцию и выгрузить данные в DataFrame. Если Python совсем новый — у автора есть бесплатный вводный курс, ссылка дана в первом уроке.
LLM — с нуля. Промпт, контекст, температура, токены, галлюцинация, few-shot — всё вводится по ходу, опыта работы с моделями не требуется.
Доступ к LLM-API (Claude или OpenAI) для практики в Colab. Задания внутри Stepik работают без него — на замороженных ответах модели и реальном sqlite3.

Наши преподаватели

Как проходит обучение

Курс построен как рабочая консультация старшего аналитика, который сам набил шишки на галлюцинациях модели, — без хайпа про «революцию ИИ» и с оговоркой, где модель ломается. Каждый урок — короткая теория и сразу практика: SQL-задачи и код на чистом Python проверяются автотестами прямо в Stepik (спасибо sqlite3 из стандартной библиотеки), а тяжёлая часть — реальные вызовы API, PostgreSQL, графики, локальные модели — идёт в Google Colab по пошаговой инструкции — собираете всё сами в Google Colab, без готовой заготовки. Задания — не пустышки: дистракторы взяты из настоящих ошибок модели (придуманная колонка, подменённый JOIN, перепутанные единицы), а каждый модуль наращивает один слой сквозного ассистента, который вы соберёте целиком в капстоуне.

Программа курса

Что вы получаете

Рабочий ИИ-ассистент аналитика — Python-скрипты + промпты + слой проверок, который можно направить на свою базу и использовать в работе.
Функции извлечения схемы (sqlite_master, PRAGMA, information_schema) и сборки словаря данных, которые делают промпт всегда актуальным под вашу структуру.
Слой анти-галлюцinационных проверок: статическая проверка колонок, EXPLAIN и dry-run, контрольные суммы, отлов подмены JOIN и единиц, guardrails и петля самокоррекции.
Готовый конвейер «вопрос → SQL → проверка → pandas → отчёт» с автокомментарием по цифрам и повторяемыми параметризованными отчётами.
Дашборды и нарративные отчёты на продажах, выручке и котировках MOEX — от запроса до графика и текстового вывода.
Безопасный режим для боевых данных: передача только схемы, локальные модели, read-only доступ, журнал запросов и контроль бюджета.
Капстоун-проект для портфолио — собственный ассистент на GitHub с README, демо-GIF, метрикой pass rate и готовой строчкой в резюме и для собеседования.

Сколько стоит обучение

Часто задаваемые вопросы

Как оплатить курс в рассрочку?

Как оплатить от компании?

Расскажите о курсе друзьям

Прямая ссылка на курс:
https://stepik.org/293085

ИИ-аналитик данных: text-to-SQL и автоматизация на Python