Чему вы научитесь
- • превращать реальную проблему в понятную задачу анализа данных;
- • разбираться в таблицах, текстах, изображениях, графах и других типах данных;
- • проверять качество данных и замечать пропуски, ошибки, выбросы и подозрительные результаты;
- • исследовать данные с помощью визуализаций, статистики и компьютерных симуляций;
- • применять линейную и логистическую регрессию, классификацию, кластеризацию и анализ текстов;
- • строить модели на реальных примерах: от медицины и бизнеса до исторических расследований;
- • оценивать качество моделей и понимать, почему высокая точность ещё не означает хорошее исследование;
- • распознавать статистические ловушки, ложные корреляции, утечки данных и другие способы красиво ошибиться;
- • работать в Orange и собирать полноценный анализ без сложного программирования;
- • использовать искусственный интеллект для поиска идей, подготовки данных, объяснения моделей и проверки выводов — но не позволять ему думать вместо вас 🤖;
- • представлять результаты так, чтобы их поняли не только аналитики, но и обычные люди;
- • проходить весь путь анализа данных: от первого вопроса «Покажите ваши данные» до обоснованного решения и готового проекта.
- Мы будем не просто изучать методы, а применять их, экспериментировать, спорить с моделями, попадать в ловушки и учиться из них. Иногда серьёзно, иногда с юмором, но всегда по-настоящему 📊
О курсе
Анализ данных в век ИИ с доктором Игорем» — это практический курс для тех, кто хочет не просто смотреть на таблицы и графики, а понимать, что на самом деле говорят данные.
Сегодня искусственный интеллект может за несколько секунд построить модель, написать код и предложить убедительное объяснение. Проблема в том, что всё это может оказаться убедительной ерундой 🤖 Поэтому главная цель курса — научиться использовать современные инструменты и при этом думать, проверять и не попадаться в ловушки.
Мы пройдём весь путь анализа данных: от первого вопроса «Покажите ваши данные» до выводов, моделей и готового проекта. Будем работать с реальными примерами из медицины, бизнеса, истории, социальных сетей и повседневной жизни. Проведём компьютерные симуляции, расследуем странные закономерности и увидим, как легко получить красивый, но совершенно неправильный результат.
Почему стоит выбрать этот курс
Здесь не будет длинного изучения формул ради самих формул. Каждый метод мы сначала поймём на понятном примере, затем применим к данным и только после этого разберёмся, почему он работает и когда ему нельзя доверять.
Для практики мы будем использовать визуальную платформу Orange Data Mining, поэтому начать можно без сложного программирования. Искусственный интеллект станет нашим помощником: он поможет искать идеи, объяснять результаты, готовить данные и проверять гипотезы. Но последнее слово всегда останется за человеком.
Что входит в курс
В курсе вас ждут:
- видеолекции и пошаговые практические занятия;
- реальные наборы данных и небольшие расследования;
- интерактивные примеры и компьютерные симуляции;
- визуализация данных и поиск скрытых закономерностей;
- корреляция, линейная и логистическая регрессия;
- классификация, кластеризация и анализ текстов;
- оценка качества моделей;
- статистические ловушки, ложные корреляции и утечки данных;
- работа в Orange и использование инструментов ИИ;
- тесты, практические задания и мини-проекты.
Как проходит обучение
Смотрите урок, исследуете пример, выполняете небольшое задание и сразу применяете новый инструмент. Постепенно отдельные методы складываются в полноценный процесс анализа данных.
К концу курса вы сможете самостоятельно поставить задачу, изучить данные, выбрать подходящий метод, построить и проверить модель, а затем понятно представить результаты.
Скучные данные обещать не можем. Ошибки, загадки, ловушки и немного юмора — обязательно 📊
Для кого этот курс
Начальные требования
Для начала курса вам понадобятся:
- любознательность и желание понять, что на самом деле скрывается за цифрами;
- стремление докопаться до истины, даже если первый вывод выглядит слишком красивым;
- готовность задавать вопросы, сомневаться и проверять ответы;
- смелость вступить в бой с пропусками, ошибками, выбросами и другими представителями мира грязных данных 🧹;
- желание экспериментировать, строить гипотезы и учиться на ошибках;
- любовь к людям, природе и окружающему миру, потому что данные становятся важными только тогда, когда помогают понять реальность и сделать её немного лучше 🌍.
Знание программирования и сложной математики не требуется. Достаточно уверенно пользоваться компьютером и быть готовым думать. Всё остальное мы постепенно освоим вместе.
Наши преподаватели
Как проходит обучение
Курс можно проходить в двух форматах.
Живые занятия по субботам
Каждую субботу мы встречаемся онлайн и вместе разбираем новую тему. На занятиях будут объяснения, демонстрации в Orange, реальные примеры, компьютерные симуляции, вопросы, небольшие расследования и практические задания.
Можно задавать вопросы преподавателю, обсуждать неожиданные результаты и вместе искать, где данные пытаются нас обмануть 📊
Обучение в записи
Все занятия будут доступны в записи. Вы сможете смотреть их в удобное время, ставить видео на паузу, возвращаться к сложным моментам и проходить курс в собственном темпе.
На Stepik будут размещены материалы уроков, задания, тесты, наборы данных и дополнительные примеры. Поэтому присоединиться к курсу можно даже тогда, когда вы не можете присутствовать на живых занятиях.
Оба формата ведут по одной программе: объяснение → пример → практика → проверка понимания → применение к реальной задаче. Можно участвовать в прямых эфирах, учиться только по записям или совмещать оба варианта.
Программа курса
Что вы получаете
- После записи на курс вы получите:
- доступ к живым занятиям по субботам и возможность задавать вопросы;
- записи всех занятий, чтобы учиться в удобное время и возвращаться к сложным моментам;
- структурированную программу на Stepik с материалами, тестами и практическими заданиями;
- реальные наборы данных из медицины, бизнеса, истории, социальных сетей и повседневной жизни;
- готовые схемы работы в Orange Data Mining, которые можно повторять, изменять и применять к своим задачам;
- компьютерные симуляции, интерактивные примеры и небольшие исследования;
- практику работы с визуализациями, статистикой, регрессией, классификацией, кластеризацией и анализом текстов;
- разбор статистических ловушек, ложных закономерностей и других способов уверенно прийти к совершенно неправильному выводу;
- навыки грамотного использования ИИ: от поиска идеи до проверки и объяснения результата 🤖;
- задания и мини-проекты, которые помогут пройти весь путь от грязных данных до обоснованных выводов;
- общение с другими участниками, совместные обсуждения, вопросы и поиск решений;
- объяснения, истории и фирменные шутки доктора Игоря — потому что анализ данных может быть серьёзным, но не обязан быть скучным 😄.