Python для DE: фундамент и обработка данных

Курс для тех, кто уже знает базовый Python и хочет перейти от учебных упражнений к нормальной работе с записями, файлами, датами и маленькими batch-наборами данных.
Средний уровень

Чему вы научитесь

  • чистить строки и собирать записи;
  • работать со списками словарей;
  • читать CSV и JSON;
  • разбирать даты, timezone offset и денежные поля;
  • ловить дубли, пропуски и кривые значения;
  • собирать маленький pipeline обработки данных.

О курсе

Python для DE: фундамент и обработка данных

Курс для тех, кто уже знает базовый Python, но пока не понимает, как применять его к данным.

Здесь тренируем рабочий слой между учебными задачами и первыми задачами инженера данных: разобрать CSV или JSON, почистить вход, привести типы, обработать даты и суммы, найти дубли, отделить хорошие строки от бракованных и собрать небольшой batch-пайплайн.

В курсе 40 практических code-задач. В каждой задаче есть тестовые данные, подсказки и блок «Если решение не проходит» с типичными ошибками. Это не заменяет мышление готовым ответом, но помогает не застревать на мелочах.

Как устроен курс

  • Короткий текстовый шаг: что сейчас тренируется, где типичная ловушка и зачем это нужно в DE.

  • Дальше практические Python-задачи прямо в Stepik.

  • В задачах используются строки, списки словарей, CSV, JSON, даты, суммы, дубли и кривые значения.

  • В финале небольшой связный кейс на обработку данных.

Общий маршрут простой: вход - очистка - приведение типов - transform - проверка результата.

Что ты будешь тренировать

  • Строки, списки, множества, кортежи и записи.

  • Условия, циклы и работу со списками словарей.

  • Функции, словари, счетчики, группировки и snapshot-структуры.

  • CSV, JSON, пути и работу с файлами стандартной библиотекой.

  • Даты, timezone offset, UTC-день, late event и денежные поля через Decimal.

  • Dedup, merge по ключу, rejected rows и простые batch-проверки.

  • Маленькие pipeline-задачи без тяжелых библиотек и лишней магии.

Что будет после курса

  • Ты перестанешь воспринимать Python как набор разрозненных упражнений.

  • Научишься читать и обрабатывать сырой CSV и JSON.

  • Будешь спокойнее работать с датами, суммами, дубликатами, пропусками и другими скучными, но дорогими поломками.

  • Сможешь собирать простые transform и batch-скрипты без ощущения, что все разваливается от первого edge-case.

  • Подготовишь нормальную базу для следующего уровня DE-Python: API, retry, batch rerun и оркестрация.

Что не требуется

  • pandas.

  • ООП.

  • asyncio.

  • Airflow.

  • Продовый опыт.

Важно

  • Это первый курс в линейке. Он не пытается закрыть весь DE-стек сразу.

  • Сильный SQL полезен, но не обязателен как входной фильтр.

  • Доступ ко всем материалам и будущим обновлениям сохраняется.

  • Если курс не подойдет, возврат работает по правилам Stepik.

Больше пользы в Telegram: разборы задач, практические кейсы, ошибки из продакшена и материалы по SQL и DE.

Для кого этот курс

Ты уже знаешь базовый Python: строки, списки, словари, if, for, функции и import. Хочешь перейти от учебных задач к обработке данных. Работаешь аналитиком, junior data-специалистом или заходишь в DE-практику. Ищешь практику с CSV, JSON и batch-кейсами, а не еще один курс про синтаксис.

Начальные требования

  • ты спокойно работаешь в Python со строками, списками, словарями и множествами;
  • умеешь писать короткие функции и простые циклы;
  • не теряешься от import и стандартной библиотеки;
  • готов читать условие, писать код и руками проверять результат.

Что желательно, но не обязательно:

  • общее понимание, что такое запись, batch, дубликат, агрегация;
  • SQL на базовом уровне;
  • интерес к DE или ETL-задачам.

Что не требуется:

  • pandas;
  • ООП;
  • asyncio;
  • API;
  • Airflow;
  • production-опыт.

Наши преподаватели

Как проходит обучение

Формат курса практический:

  • короткий текстовый шаг;
  • дальше Python code-задачи в Stepik;
  • в нужных местах dataset-шаг с CSV или JSON;
  • в конце маленький связный case.

Главный упор здесь на код и на работу руками.

Программа курса

загружаем...

Что вы получаете

  • После курса ты сможешь:
  • уверенно писать Python для типовых задач по обработке данных;
  • читать и преобразовывать сырой CSV и JSON;
  • работать с датами, денежными значениями и кривыми полями;
  • собирать простые transform и batch-проверки;
  • понимать, как из этого вырастает следующий слой ETL-практики.

Сколько стоит обучение

Price: 2 500 
Вы попробовали и поняли, что вам сейчас не подходит этот курс? Ничего страшного, мы вернём вам деньги в течение 30-ти дней после покупки.

Часто задаваемые вопросы

Расскажите о курсе друзьям

Price: 2 500