ИИ-аналитик данных: text-to-SQL и автоматизация на Python

Практический курс о том, как заставить LLM писать SQL за вас и ловить, когда она врёт: от первого запроса на русском за вечер до своего ИИ-ассистента аналитика с анти-галлюцинационным слоем на боевых данных. Практика — на SQLite прямо в Stepik, реальные LLM-вызовы — в Colab.
4–6 часов в неделю · 7 недель

Чему вы научитесь

  • Описывать модели схему своей базы (таблицы, типы, ключи, словарь бизнес-терминов), чтобы SQL попадал в реальную структуру, а не в выдуманную
  • Превращать вопрос на русском в рабочий SQL через LLM-API для PostgreSQL и SQLite — с JOIN, агрегатами, оконными функциями и фильтрами по периодам
  • Ловить галлюцинации модели до отчёта: статическая проверка колонок, EXPLAIN и dry-run, контрольные суммы, отлов подмены INNER/LEFT JOIN и перепутанных единиц
  • Ставить guardrails и петлю самокоррекции: блокировать DML, чинить ошибочный запрос автоматически
  • Собирать конвейер «вопрос → SQL → проверка → pandas → отчёт» на Python, который выдаёт проверенную таблицу с автокомментарием по цифрам
  • Строить дашборды и нарративные отчёты на продажах, выручке и котировках MOEX — от запроса до графика и текстового вывода
  • Работать с боевыми данными безопасно: передавать модели только схему, держать данные локально, ставить read-only доступ, логи запросов и контроль бюджета
  • Упаковывать собственного ИИ-ассистента аналитика в проект для GitHub: README, демо, метрика качества, строчка в резюме

О курсе

Большинство SQL-курсов учат писать запросы. Этот — учит заставить LLM писать их за вас и ловить, когда она врёт. Если SQL и отчётность — ваша ежедневная работа, вы знаете цену рутине: двадцатую вариацию «выручка по сегментам за квартал с фильтром по региону» приходится собирать руками каждый раз. Хочется продиктовать задачу на русском и получить готовый запрос. Но как только цифра из такого запроса уходит в слайд руководству, появляется второй, главный страх: модель уверенно придумывает колонку revenue_total вместо amount, тихо меняет INNER JOIN на LEFT и раздувает сумму втрое. Запрос при этом выполняется без единой ошибки — он не «упал», он просто врёт.

Причина не в «глупости» модели: ChatGPT в браузере пишет SQL «вообще», он не видит ваши таблицы, ключи и единицы. Решение — не «промпт получше», а инженерный слой вокруг модели: передать ей точную схему вашей базы, а сгенерированный SQL прогнать через проверки до того, как он коснётся отчёта. Этот курс разбирает text-to-SQL как пайплайн с контролем качества, а не как «спросить ИИ и скопировать ответ». Не «генерация SQL по кнопке», а три отдельных навыка: передать модели схему и словарь терминов, поймать галлюцinацию на тестовой выборке и объяснить безопаснику, что именно уходит в облако, а что нет.

Ядро курса — анти-галлюцinационный слой. Вы разберёте каталог типовых ошибок text-to-SQL на учебной базе и научитесь ловить каждую: статическая проверка (существуют ли таблицы и колонки, парсится ли SQL), проверка на данных (EXPLAIN, dry-run, контрольные суммы вроде COUNT(*) и сверка сумм), отлов подменённого JOIN и перепутанных единиц через сверку с эталоном, плюс guardrails и петля самокоррекции. Это то, что отличает рабочий ассистент от «ChatGPT, напиши SQL» — и то, что делает результат пригодным для боевых данных.

Внутри: 8 модулей, 30 уроков, ~289 проверяемых шагов. Главный плюс формата — sqlite3 входит в стандартную библиотеку Python, поэтому реальный SQL по учебной базе, проверка колонок, парсинг запросов и контрольные суммы запускаются прямо в Stepik, а не «на словах». Реальные вызовы LLM-API (Claude, OpenAI), боевой PostgreSQL через psycopg2, графики и локальные модели (Ollama) выносятся в Google Colab с пошаговой инструкцией — вы собираете решение сами в Google Colab, а не открываете готовую заготовку. Практикуете на узнаваемых данных: таблицы продаж и выручки (orders, order_items, products, customers) и котировки MOEX — SBER, LKOH, GAZP. Финал — капстоун: вы собираете собственного ИИ-ассистента аналитика, прогоняете его на своей базе с мини-eval (цель — pass rate ≥ 0.8 на контрольных вопросах) и упаковываете в проект для GitHub с README и демо.

Сквозной пример курса — ассистент sql-аналитик над учебной базой shop.db, который от модуля к модулю обрастает слоями: знание схемы, генерация SQL, слой проверок, конвейер до отчёта, дашборд и безопасный режим для боевых данных. Реалистичный сценарий: с выдуманными колонками, подменёнными JOIN, перепутанными рублями и копейками, требованием не выгружать клиентскую базу в чужую модель и вопросом безопасника «что именно уходит в облако». Такой же запрос, с каким вы столкнётесь на следующей неделе на своих данных.

Для кого этот курс

Аналитики данных и продуктовые аналитики, которые пишут SELECT с JOIN и оконными функциями и хотят диктовать рутинные запросы на русском, а не собирать двадцатую вариацию руками. Финансовые аналитики, уже знакомые с Python и pandas (например, по фин-треку автора), для кого SQL и базы данных новее, чем Excel, — работа с выручкой, P&L, продажами и котировками. BI-специалисты и аналитики отчётности, у которых десятки готовых запросов, и чья боль не «как написать SQL», а «как не перепроверять руками каждую цифру, которую выдала модель». Все, кто уже умеет считать данные руками и знает, как выглядит правильный ответ, хочет ускориться через ИИ, но не готов отправлять неверные числа в отчёт руководству.

Начальные требования

Честно, чтобы вы не разочаровались на третьем уроке:

  • SQL — базовый уровень. Вы пишете SELECT с JOIN и GROUP BY и понимаете, как выглядит правильный результат. Мы не объясняем SQL с нуля — мы учим заставить модель писать его и проверять за ней.
  • Python и pandas — базовый уровень. Достаточно уметь написать функцию и выгрузить данные в DataFrame. Если Python совсем новый — у автора есть бесплатный вводный курс, ссылка дана в первом уроке.
  • LLM — с нуля. Промпт, контекст, температура, токены, галлюцинация, few-shot — всё вводится по ходу, опыта работы с моделями не требуется.
  • Доступ к LLM-API (Claude или OpenAI) для практики в Colab. Задания внутри Stepik работают без него — на замороженных ответах модели и реальном sqlite3.

Наши преподаватели

Как проходит обучение

Курс построен как рабочая консультация старшего аналитика, который сам набил шишки на галлюцинациях модели, — без хайпа про «революцию ИИ» и с оговоркой, где модель ломается. Каждый урок — короткая теория и сразу практика: SQL-задачи и код на чистом Python проверяются автотестами прямо в Stepik (спасибо sqlite3 из стандартной библиотеки), а тяжёлая часть — реальные вызовы API, PostgreSQL, графики, локальные модели — идёт в Google Colab по пошаговой инструкции — собираете всё сами в Google Colab, без готовой заготовки. Задания — не пустышки: дистракторы взяты из настоящих ошибок модели (придуманная колонка, подменённый JOIN, перепутанные единицы), а каждый модуль наращивает один слой сквозного ассистента, который вы соберёте целиком в капстоуне. 

Программа курса

загружаем...

Что вы получаете

  • Рабочий ИИ-ассистент аналитика — Python-скрипты + промпты + слой проверок, который можно направить на свою базу и использовать в работе.
  • Функции извлечения схемы (sqlite_master, PRAGMA, information_schema) и сборки словаря данных, которые делают промпт всегда актуальным под вашу структуру.
  • Слой анти-галлюцinационных проверок: статическая проверка колонок, EXPLAIN и dry-run, контрольные суммы, отлов подмены JOIN и единиц, guardrails и петля самокоррекции.
  • Готовый конвейер «вопрос → SQL → проверка → pandas → отчёт» с автокомментарием по цифрам и повторяемыми параметризованными отчётами.
  • Дашборды и нарративные отчёты на продажах, выручке и котировках MOEX — от запроса до графика и текстового вывода.
  • Безопасный режим для боевых данных: передача только схемы, локальные модели, read-only доступ, журнал запросов и контроль бюджета.
  • Капстоун-проект для портфолио — собственный ассистент на GitHub с README, демо-GIF, метрикой pass rate и готовой строчкой в резюме и для собеседования.

Сколько стоит обучение

Price: 1 490 
Вы попробовали и поняли, что вам сейчас не подходит этот курс? Ничего страшного, мы вернём вам деньги в течение 30-ти дней после покупки.

Часто задаваемые вопросы

Расскажите о курсе друзьям

Price: 1 490