О курсе
Добро пожаловать на курс "Поиск структуры в данных" – третий курс программы "Машинное обучение и анализ данных".
В машинном обучении встречаются задачи, где нужно изучить структуру данных, найти в них скрытые взаимосвязи и закономерности. Например, нам может понадобиться описать каждого клиента банка с помощью меньшего количества переменных — для этого можно использовать методы понижения размерности, основанные на матричных разложениях. Такие методы пытаются сформировать новые признаки на основе старых, сохранив как можно больше информации в данных.
Из этого курса вы узнаете об алгоритмах кластеризации данных, с помощью которых, например, можно искать группы схожих клиентов мобильного оператора. Вы научитесь строить матричные разложения и решать задачу тематического моделирования, понижать размерность данных, искать аномалии и визуализировать многомерные данные.
Темы курса:
- Методы кластеризации.
- Понижение размерности и матричные разложения.
- Визуализация данных и поиск аномалий.
- Тематическое моделирование.
Начальные требования
Прохождение первых двух курсов программы "Машинное обучение и анализ данных".
Базовые знания Python, математического анализа, линейной алгебры и статистики.