Чему вы научитесь
- понимать область применения и ограничения методов NLP
- проводить базовые операции в Python
- проводить предобработку данных и подбирать подходящий метод: регулярные выражения, токенизация, лемматизация, стемминг, стоп-слов
- векторизировать данные методами Bag-of-Words, частотные модели, TF-IDF
- понимать базовые принципы машинного обучения в NLP и выбирать подходящие методы и метрики для оценки (MSE, recall, accuracy, F1-мера)
- понимать, как устроены современные нейронные сети и языковые модели
- решать задачи с помощью библиотеки transformers (Zero-shot classification, генерация текста NER, question-answering, question-answering, перевод)
- понимать, какие этические проблемы стоят перед специалистом, использующим NLP
О курсе
Обработка естественного языка применяется в самых разных профессиональных областях: в бизнес-аналитике, маркетинге и коммуникациях, праве, образовании, журналистике и медиа. Работа с текстовыми данными становится такой же важной частью профессии, как работа с таблицами и визуализациями.
При создании курса мы ориентировались на тех, кто хочет уверенно использовать инструменты анализа текста в своей основной деятельности: исследовать большие массивы документов, извлекать информацию из текстов, анализировать текстовые данные, автоматизировать рутинные задачи.
Курс не ставит целью подготовку ML-инженеров или разработчиков. Наша задача – дать системное понимание того, как устроены текстовые данные и какие методы применяются для их обработки, а также научить работать с современными инструментами NLP на практике.
В рамках курса вы:
-
разберётесь, как представляются и структурируются текстовые данные;
-
освоите базовые методы предобработки и векторизации текста;
-
познакомитесь с классическими алгоритмами анализа текста и основами современных языковых моделей;
-
научитесь строить и интерпретировать простые модели для прикладных задач.
Курс сочетает теоретическую основу и практическую работу с кодом, чтобы вы могли применять полученные знания на задачах, максимально приближенных к реальности.
Для кого этот курс
Начальные требования
Будет здорово, если у вас есть минимальный опыт работы с Python, однако мы постарались подготовить курс для всех, поэтому вам не требуется специальных знаний в программировании, статистике или математике, мы всё объясним!
Наши преподаватели
Как проходит обучение
Курс предоставлен в текстовом формате, поэтому вы сможете его изучать в любом месте и на любом устройстве. В программе также будут проверочные задания и задачи на программирование с автоматической проверкой.
В среднем прохождение курса у наших студентов занимает 7-8 часов.