Чему вы научитесь
- чистить строки и собирать записи;
- работать со списками словарей;
- читать CSV и JSON;
- разбирать даты, timezone offset и денежные поля;
- ловить дубли, пропуски и кривые значения;
- собирать маленький pipeline обработки данных.
О курсе
Python для DE: фундамент и обработка данных
Курс для тех, кто уже знает базовый Python, но пока не понимает, как применять его к данным.
Здесь тренируем рабочий слой между учебными задачами и первыми задачами инженера данных: разобрать CSV или JSON, почистить вход, привести типы, обработать даты и суммы, найти дубли, отделить хорошие строки от бракованных и собрать небольшой batch-пайплайн.
В курсе 40 практических code-задач. В каждой задаче есть тестовые данные, подсказки и блок «Если решение не проходит» с типичными ошибками. Это не заменяет мышление готовым ответом, но помогает не застревать на мелочах.
Как устроен курс
-
Короткий текстовый шаг: что сейчас тренируется, где типичная ловушка и зачем это нужно в DE.
-
Дальше практические Python-задачи прямо в Stepik.
-
В задачах используются строки, списки словарей,
CSV,JSON, даты, суммы, дубли и кривые значения. -
В финале небольшой связный кейс на обработку данных.
Общий маршрут простой: вход - очистка - приведение типов - transform - проверка результата.
Что ты будешь тренировать
-
Строки, списки, множества, кортежи и записи.
-
Условия, циклы и работу со списками словарей.
-
Функции, словари, счетчики, группировки и snapshot-структуры.
-
CSV,JSON, пути и работу с файлами стандартной библиотекой. -
Даты, timezone offset, UTC-день, late event и денежные поля через
Decimal. -
Dedup, merge по ключу, rejected rows и простые batch-проверки.
-
Маленькие pipeline-задачи без тяжелых библиотек и лишней магии.
Что будет после курса
-
Ты перестанешь воспринимать Python как набор разрозненных упражнений.
-
Научишься читать и обрабатывать сырой
CSVиJSON. -
Будешь спокойнее работать с датами, суммами, дубликатами, пропусками и другими скучными, но дорогими поломками.
-
Сможешь собирать простые transform и batch-скрипты без ощущения, что все разваливается от первого edge-case.
-
Подготовишь нормальную базу для следующего уровня DE-Python:
API, retry, batch rerun и оркестрация.
Что не требуется
-
pandas. -
ООП.
-
asyncio. -
Airflow. -
Продовый опыт.
Важно
-
Это первый курс в линейке. Он не пытается закрыть весь DE-стек сразу.
-
Сильный SQL полезен, но не обязателен как входной фильтр.
-
Доступ ко всем материалам и будущим обновлениям сохраняется.
-
Если курс не подойдет, возврат работает по правилам Stepik.
Больше пользы в Telegram: разборы задач, практические кейсы, ошибки из продакшена и материалы по SQL и DE.
Для кого этот курс
Начальные требования
- ты спокойно работаешь в Python со строками, списками, словарями и множествами;
- умеешь писать короткие функции и простые циклы;
- не теряешься от import и стандартной библиотеки;
- готов читать условие, писать код и руками проверять результат.
Что желательно, но не обязательно:
- общее понимание, что такое запись, batch, дубликат, агрегация;
- SQL на базовом уровне;
- интерес к DE или ETL-задачам.
Что не требуется:
- pandas;
- ООП;
- asyncio;
- API;
- Airflow;
- production-опыт.
Наши преподаватели
Как проходит обучение
Формат курса практический:
- короткий текстовый шаг;
- дальше Python code-задачи в Stepik;
- в нужных местах dataset-шаг с CSV или JSON;
- в конце маленький связный case.
Главный упор здесь на код и на работу руками.
Программа курса
Что вы получаете
- После курса ты сможешь:
- уверенно писать Python для типовых задач по обработке данных;
- читать и преобразовывать сырой CSV и JSON;
- работать с датами, денежными значениями и кривыми полями;
- собирать простые transform и batch-проверки;
- понимать, как из этого вырастает следующий слой ETL-практики.