Чему вы научитесь
- познакомитесь с основами работы с текстом
- освоите парсинг и скрапинг данных
- потренируете базовые подходы к обработке и векторизации текстовых данных
- закрепите полученные знания, выполняя тесты и домашние задания в рамках курса
- поучаствуете в соревновании по анализу текстовых данных на платформе Kaggle
О курсе
На мини-курсе вы познакомитесь с некоторыми подходами к обработке текста. Также вы погрузитесь в обработку текстовых данных и узнаете, как делать скрапинг и парсинг. Вы сможете отработать полученные знания, выполняя тесты и домашние задания в рамках курса. В конце курса вы сможете поучаствовать в соревновании по анализу текстовых данных.
Вся актуальная информация о дате и времени занятий будет появляться в телеграм-канале AI Education.
И не забудьте присоединиться к нашему чату для обсуждения практических заданий и соревнования!
Для кого этот курс
Этот курс будет интересен тем, кто уже знаком с Python, уверенно знает математику в рамках школьной программы и хотел бы познакомиться с машинным обучением и подходами к решению задач обработки естественного языка, а также научиться собирать данные из открытых источников при помощи скрапинга и парсинга. Если вы уже имеете опыт решения задач машинного обучения, то курс вам тоже понравится - вы сможете посоревноваться в задаче NLP с другими участниками курса в рамках соревнования на платформе Kaggle.
Начальные требования
- уверенные знания школьного курса математики
- умение писать код на Python (на начальном уровне)
Наши преподаватели
Как проходит обучение
Курс состоит из четырех онлайн-занятий:
- Работа со строками в Python. Регулярные выражения.
- Bag-of-words. Tf-Idf.
- Скрапинг и парсинг.
- Стоп-слова, лемматизация, стемминг. N-граммы. Word2Vec.
Кроме занятий, для слушателей будут доступны дополнительные текстовые материалы на Stepik и предложены практические задания для самостоятельного решения.
После всех занятий откроется соревнование по решению NLP-задачи на платформе Kaggle!
Программа курса
Что вы получаете
- Повторите основные понятия и терминологию из области машинного обучения
- Научитесь решать табличные задачи классификации и регрессии
- Овладеете базовыми методами работы с текстами
- Научитесь добывать информацию из интернета при помощи скрапинга и Парсинга
- Получите опыт участия в соревновании по анализу текстовых данных на платформе Kaggle