|
Курс · Python · Pandas
О курсе
Pandas: практический анализ табличных данных
Курс по Pandas для тех, кто хочет уверенно работать с таблицами: читать данные, очищать их, фильтровать, группировать, объединять таблицы, работать с датами, готовить отчёты, графики и проекты.
|
Главная идея курса
Pandas - один из главных инструментов Python для работы с табличными данными. На курсе мы не просто перечисляем методы, а учимся проходить полный путь анализа: от загрузки файла до итогового отчёта.
Курс подойдёт тем, кто уже знает основы Python и хочет перейти к практической работе с данными.
|
Для кого этот курс
|
1. Для тех, кто уже знает базовый Python и хочет научиться анализировать таблицы.
2. Для тех, кто работает с CSV, Excel или JSON и хочет обрабатывать данные быстрее и аккуратнее.
3. Для тех, кто готовится к анализу данных, Data Science, машинному обучению или аналитическим задачам на работе.
4. Для тех, кто хочет не просто копировать готовые команды, а понимать, как строится обработка данных шаг за шагом.
|
Что вы изучите
|
Основы Pandas. Что такое Series и DataFrame, как устроены строки, столбцы, индекс и первые методы просмотра таблицы.
Чтение данных. Как загружать данные из CSV, Excel, JSON и словарей через read_csv(), read_excel() и read_json().
Выбор и фильтрация. Как выбирать столбцы и строки, использовать loc, iloc, булевы маски, несколько условий, isin() и between().
Очистка данных. Как работать с пропусками, типами данных, дубликатами и текстовыми значениями.
Аналитика и отчёты. Как создавать новые столбцы, считать статистики, использовать groupby(), agg() и transform().
Объединение таблиц. Как применять concat() и merge(), чтобы собирать данные из нескольких источников.
Даты, reshape и графики. Как работать с датами через to_datetime() и .dt, менять форму таблицы через pivot_table() и melt(), готовить данные для графиков.
Мини-проекты и экзамены. Как применять Pandas в накопительных задачах, где нужно собрать полный путь обработки данных.
|
Программа курса
|
1. Введение в Pandas Что такое Pandas, зачем он нужен и какие задачи решает при работе с табличными данными.
2. Series и DataFrame Объекты Series и DataFrame, первые методы просмотра, форма таблицы, типы столбцов и первичный осмотр данных.
3. Чтение и запись данных CSV, Excel, JSON и словари. Чтение данных из разных форматов и подготовка таблицы к дальнейшей работе.
4. Выбор столбцов и строк Выбор одного и нескольких столбцов, строки через loc и iloc, присваивание значений и аккуратная работа с частями таблицы.
5. Фильтрация данных Булевы маски, несколько условий, isin(), between() и простые шаблоны отбора строк.
6. Сортировка, статистики и новые столбцы Сортировка строк, простые статистики, расчёт новых показателей и подготовка таблицы к отчёту.
7. Пропуски, типы и дубликаты Поиск пропусков, удаление и заполнение значений, преобразование типов, работа с дубликатами и проверка качества данных.
8. Строковые данные
str accessor, разделение и замена строк, текстовая очистка, поиск фрагментов и приведение категорий к единому виду.
9. Группировка и агрегация
groupby(), несколько агрегаций, transform() и простые кейсы построения отчётов по группам.
10. Объединение таблиц
concat(), merge(), ключи соединения, типичные ошибки и сбор данных из нескольких таблиц.
11. Даты и время Преобразование дат, dt accessor, месячные отчёты и простая временная аналитика.
12. Pivot, melt и форма таблицы Длинный и широкий формат, pivot, pivot_table() и melt() для перестройки таблицы под задачу.
13. Map, apply и векторный стиль
map(), apply(), векторный стиль и понимание того, когда лучше мыслить столбцами, а не отдельными строками.
14. Быстрая визуализация Быстрые графики и подготовка данных для визуализации: группировка, сортировка и выбор подходящей формы таблицы.
15. Экзамены Три промежуточных экзамена и финальный экзамен: теория, практические задачи и проверка понимания всего курса.
16. Мини-проекты Накопительные задачи: продажи магазина, успеваемость студентов, доставка и задержки заказов.
|
После курса вы сможете
|
Читать данные из CSV, Excel и JSON, быстро осматривать таблицу и понимать, какие проблемы есть в данных.
Выбирать нужные строки и столбцы, фильтровать данные по условиям, создавать новые столбцы и рассчитывать показатели.
Обрабатывать пропуски, типы данных, дубликаты и строковые значения, чтобы таблица стала пригодной для анализа.
Собирать отчёты через groupby() и agg(), соединять таблицы через concat() и merge().
Работать с датами, менять форму таблицы через pivot_table() и melt(), готовить данные для графиков и проектов.
|
Формат обучения
|
Теория. Каждая тема объясняется постепенно: сначала идея, затем примеры, типичные ошибки и короткие проверки понимания.
Практика. В курсе много code-задач с автоматической проверкой, где нужно писать реальный Pandas-код.
Экзамены. После крупных блоков есть экзамены, которые проверяют не запоминание одной команды, а понимание темы целиком.
Проекты. В конце курса есть мини-проекты и финальная практическая часть, где нужно соединять несколько навыков в одну цепочку обработки данных.
|
Главное
Этот курс помогает перейти от базового Python к уверенной работе с табличными данными. После курса вы будете понимать не только отдельные команды Pandas, но и общий путь анализа: прочитать данные, проверить их, подготовить, посчитать показатели и собрать итоговый результат.
|
|