DBT: Быстрый старт для аналитики данных. SQLite, ClickHouse

Научитесь использовать силу DBT, писать чистый код без повторов, запускать тесты качества данных на практике.
Начальный уровень
4-5 часов в неделю

Чему вы научитесь

  • Объяснять принципы медальонной архитектуры данных (Bronze -> Silver -> Gold) и концепцию ELT (Extract-Load-Transform).
  • Анализировать «грязные» сырые данные, находить дубликаты, аномалии, опечатки и скрытые технические ошибки в бизнес-слоях.
  • Сравнивать различные типы материализации dbt.
  • Разворачивать и конфигурировать dbt-проект с нуля как в облачной песочнице (Google Colab), так и в локальной среде разработки.
  • Настраивать файлы конфигурации подключения profiles.yml и изолировать доступы к базам данных от самого кода.
  • Регистрировать внешние таблицы и управлять ими через централизованные источники данных sources.yml.
  • Создавать динамические переиспользуемые SQL-скрипты, используя шаблонизатор Jinja и собственные кастомные макросы.
  • Разрабатывать и внедрять автоматические тесты качества данных (unique, not_null, accepted_values), защищая проект от технического мусора.
  • Генерировать интерактивную документацию и визуальные графы связей данных (Lineage Graph) одной командой.

О курсе

  • Обучение проходит в облаке Google Colab. Ничего не нужно скачивать и настраивать на своём компьютере — вы начнёте писать код с первой минуты.
  • Профессиональная архитектура: Вы построите проект по современному стандарту Medallion Architecture (Bronze → Silver → Gold).
  • Полный цикл разработки: Вы научитесь не просто писать SQL, а автоматически тестировать данные на ошибки (dbt test) и генерировать интерактивную документацию

Для кого этот курс

SQL-аналитики и BI-разработчики, которые хотят вырасти до Analytics Engineer, избавиться от рутины и писать чистый, поддерживаемый код. Начинающие дата-инженеры, желающие освоить dbt — главный инструмент трансформации данных на рынке.

Начальные требования

1. Знание SQL (Базовый уровень)

Вы должны уверенно понимать основы синтаксиса SQL, так как dbt полностью построен на нём. Вам пригодятся знания:

  • Простых запросов (select, from, where).
  • Агрегатных функций (count, sum, group by).
  • Объединения таблиц (left join, inner join).
  • Понимание CTE (конструкций with ... as) будет большим плюсом, но если вы с ними не знакомы — мы научимся им в процессе.

2. Минимальные технические ресурсы

Если вы выбираете рекомендуемый простой путь обучения (в облаке Google Colab):

  • Компьютер: Подойдет абсолютно любой рабочий ноутбук или ПК (даже самый слабый).
  • Браузер: Актуальная версия любого современного браузера (Chrome, Safari, Firefox, Edge).
  • Аккаунт: Наличие учетной записи Google (Google Account) для запуска Colab.

3. Навыки работы с компьютером

  • Базовое понимание, как работают папки и файлы.
  • Отсутствие страха перед черным окном терминала (командной строкой) — все нужные команды мы будем давать с подробными подсказками.

Наши преподаватели

Как проходит обучение

Курс разработан по принципу «минимум лекций — максимум кода» и состоит из последовательных практических шагов:

  1. Теоретический спринт: Каждый урок начинается с короткого разбора концепции (например, зачем нужен слой Silver или как работает макрос ref).
  2. Интерактивная практика: Вы пошагово выполняете готовый код прямо в Google Colab. Вы сразу видите, как сырые данные превращаются в чистые витрины.
  3. Контроль знаний: В конце каждого логического блока вы проходите интерактивные тесты с вариантами ответов для закрепления теории.
  4. Лабораторные работы (ТЗ): Вы получаете реальные бизнес-задачи (технические задания) на очистку и агрегацию данных, которые решаете самостоятельно внутри dbt-проекта.
  5. Автоматическая проверка: Вы запускаете команду !dbt test и по логам консоли мгновенно понимаете, правильно ли выполнено задание

Программа курса

загружаем...

Отзывы прошедших курс

5
из 5
из 1 отзыва
1 отзыв
загружаем...

Что вы получаете

  • Умение проектировать данные по слоям современной архитектуры медальона (Bronze → Silver → Gold).
  • Навык автоматического контроля качества данных (Data Quality) с помощью запуска тестов, которые сами ловят дубликаты и пустые значения.
  • Понимание принципов «чистого кода» (Best Practices) в аналитике: умение писать переиспользуемые макросы на Jinja и организовывать SQL через CTE.

Сколько стоит обучение

Price: 2 000 
Вы попробовали и поняли, что вам сейчас не подходит этот курс? Ничего страшного, мы вернём вам деньги в течение 30-ти дней после покупки.

Часто задаваемые вопросы

Расскажите о курсе друзьям

Price: 2 000