Основы анализа текстовых данных

Анализ и обработка текстовых данных методами машинного обучения. Классификация, кластеризация, выявление нечетких дубликатов текстов

About this course

Настоящий курс посвящен моделям и методам машинного обучения (Machine learning) и анализа текстовых данных (Data and Text Mining). Рассматриваются все основные этапы обработки и анализа, включая вопросы формирования выборок, математического описания документов, выявления информативных терминов, обучения и тестирования известных  индивидуальных и коллективных классификаторов, оценки качества полученных результатов. Рассматриваются методы кластеризации данных, выявления нечетких дубликатов.

Initial requirements

Начальные знания в области теории вероятностей и математической статистики, методов оптимизации, искусственных нейронных сетей  и языка программирования Python.

Meet the Instructors

Course content

loading...
Price: Free

Share this course

Price: Free