Pandas: практический анализ табличных данных

Практический курс по Python и Pandas для анализа данных. Научитесь работать с таблицами, CSV, Excel и JSON, очищать данные, фильтровать строки, создавать новые столбцы, использовать DataFrame, groupby, merge, pivot_table и строить отчёты. Много практики, экзамены и мини-проекты для старта в Data Science и аналитике.
Начальный уровень
4-5

О курсе

Курс · Python · Pandas

О курсе

Pandas: практический анализ табличных данных

Курс по Pandas для тех, кто хочет уверенно работать с таблицами: читать данные, очищать их, фильтровать, группировать, объединять таблицы, работать с датами, готовить отчёты, графики и проекты.

Главная идея курса

Pandas - один из главных инструментов Python для работы с табличными данными. На курсе мы не просто перечисляем методы, а учимся проходить полный путь анализа: от загрузки файла до итогового отчёта.

Курс подойдёт тем, кто уже знает основы Python и хочет перейти к практической работе с данными.

Для кого этот курс

1. Для тех, кто уже знает базовый Python и хочет научиться анализировать таблицы.

2. Для тех, кто работает с CSV, Excel или JSON и хочет обрабатывать данные быстрее и аккуратнее.

3. Для тех, кто готовится к анализу данных, Data Science, машинному обучению или аналитическим задачам на работе.

4. Для тех, кто хочет не просто копировать готовые команды, а понимать, как строится обработка данных шаг за шагом.

Что вы изучите

Основы Pandas. Что такое Series и DataFrame, как устроены строки, столбцы, индекс и первые методы просмотра таблицы.

Чтение данных. Как загружать данные из CSV, Excel, JSON и словарей через read_csv(), read_excel() и read_json().

Выбор и фильтрация. Как выбирать столбцы и строки, использовать loc, iloc, булевы маски, несколько условий, isin() и between().

Очистка данных. Как работать с пропусками, типами данных, дубликатами и текстовыми значениями.

Аналитика и отчёты. Как создавать новые столбцы, считать статистики, использовать groupby(), agg() и transform().

Объединение таблиц. Как применять concat() и merge(), чтобы собирать данные из нескольких источников.

Даты, reshape и графики. Как работать с датами через to_datetime() и .dt, менять форму таблицы через pivot_table() и melt(), готовить данные для графиков.

Мини-проекты и экзамены. Как применять Pandas в накопительных задачах, где нужно собрать полный путь обработки данных.

Программа курса

1. Введение в Pandas
Что такое Pandas, зачем он нужен и какие задачи решает при работе с табличными данными.

2. Series и DataFrame
Объекты Series и DataFrame, первые методы просмотра, форма таблицы, типы столбцов и первичный осмотр данных.

3. Чтение и запись данных
CSV, Excel, JSON и словари. Чтение данных из разных форматов и подготовка таблицы к дальнейшей работе.

4. Выбор столбцов и строк
Выбор одного и нескольких столбцов, строки через loc и iloc, присваивание значений и аккуратная работа с частями таблицы.

5. Фильтрация данных
Булевы маски, несколько условий, isin(), between() и простые шаблоны отбора строк.

6. Сортировка, статистики и новые столбцы
Сортировка строк, простые статистики, расчёт новых показателей и подготовка таблицы к отчёту.

7. Пропуски, типы и дубликаты
Поиск пропусков, удаление и заполнение значений, преобразование типов, работа с дубликатами и проверка качества данных.

8. Строковые данные
str accessor, разделение и замена строк, текстовая очистка, поиск фрагментов и приведение категорий к единому виду.

9. Группировка и агрегация
groupby(), несколько агрегаций, transform() и простые кейсы построения отчётов по группам.

10. Объединение таблиц
concat(), merge(), ключи соединения, типичные ошибки и сбор данных из нескольких таблиц.

11. Даты и время
Преобразование дат, dt accessor, месячные отчёты и простая временная аналитика.

12. Pivot, melt и форма таблицы
Длинный и широкий формат, pivot, pivot_table() и melt() для перестройки таблицы под задачу.

13. Map, apply и векторный стиль
map(), apply(), векторный стиль и понимание того, когда лучше мыслить столбцами, а не отдельными строками.

14. Быстрая визуализация
Быстрые графики и подготовка данных для визуализации: группировка, сортировка и выбор подходящей формы таблицы.

15. Экзамены
Три промежуточных экзамена и финальный экзамен: теория, практические задачи и проверка понимания всего курса.

16. Мини-проекты
Накопительные задачи: продажи магазина, успеваемость студентов, доставка и задержки заказов.

После курса вы сможете

Читать данные из CSV, Excel и JSON, быстро осматривать таблицу и понимать, какие проблемы есть в данных.

Выбирать нужные строки и столбцы, фильтровать данные по условиям, создавать новые столбцы и рассчитывать показатели.

Обрабатывать пропуски, типы данных, дубликаты и строковые значения, чтобы таблица стала пригодной для анализа.

Собирать отчёты через groupby() и agg(), соединять таблицы через concat() и merge().

Работать с датами, менять форму таблицы через pivot_table() и melt(), готовить данные для графиков и проектов.

Формат обучения

Теория. Каждая тема объясняется постепенно: сначала идея, затем примеры, типичные ошибки и короткие проверки понимания.

Практика. В курсе много code-задач с автоматической проверкой, где нужно писать реальный Pandas-код.

Экзамены. После крупных блоков есть экзамены, которые проверяют не запоминание одной команды, а понимание темы целиком.

Проекты. В конце курса есть мини-проекты и финальная практическая часть, где нужно соединять несколько навыков в одну цепочку обработки данных.

Главное

Этот курс помогает перейти от базового Python к уверенной работе с табличными данными. После курса вы будете понимать не только отдельные команды Pandas, но и общий путь анализа: прочитать данные, проверить их, подготовить, посчитать показатели и собрать итоговый результат.

Наши преподаватели

Программа курса

загружаем...
Price: Бесплатно

Расскажите о курсе друзьям

Price: Бесплатно