О курсе
Этот курс погружает учащихся в важнейшие аспекты кросс-валидации и оптимизации гиперпараметров с применением библиотеки Scikit-learn.
Начнём с изучения базовых методов оценки моделей, используя функции cross_val_score
и cross_validate
, чтобы получать более точную оценку производительности модели путем использования кросс-валидации.
Важной составляющей курса станет изучение различных стратегий кросс-валидации, таких как LeaveOneOut
, ShuffleSplit
и GroupKFold
, каждая из которых подходит для определенных типов задач и данных.
Курс также охватывает анализ кривых обучения с использованием функции learning_curve
, что поможет понять, как объем данных влияет на производительность модели.
Уделяется внимание и кривым валидации через функцию validation_curve
, которая демонстрирует, как изменение гиперпараметров отражается на качестве модели.
Изучение функции permutation_test_score
позволит оценивать значимость моделей с использованием перестановочных тестов.
Также рассматривается техника прогнозирования с кросс-валидацией через cross_val_predict
, что окажется полезным для визуализации результатов.
Наконец, познакомимся с методами оптимизации гиперпараметров, используя GridSearchCV
и RandomizedSearchCV
, что позволит автоматизировать процесс поиска наилучших гиперпараметров для моделей.
Начальные требования
Курс для тех, кто уже сделал первые шаги в изучении машинного обучения, но, столкнувшись с вопросами кросс-валидации и оптимизации гиперпараметров, ощутил необходимость более глубокого понимания этих ключевых аспектов.