О курсе
Технические аспекты анализа данных зачастую влияют на качество получаемых результатов. В последние годы в центре внимания находятся вопросы обеспечения воспроизводимости и автоматизации анализа – попытки воспроизвести результаты, полученные той или иной группой, часто проваливаются, а анализ больших массивов данных нередко проводится с использованием подручных средств.
Курс состоит из трех модулей, в которых рассматриваются Linux контейнеры и Docker (первый модуль), а также различные подходы к автоматизации процесса вычислений и инструменты, реализующие эти подходы (второй и третий модули). Использование этих инструментов позволяет сделать процесс анализа более воспроизводимым и эффективным.
Начальные требования
От учащихся потребуются навыки работы с операционной системой Linux, в том числе уверенное использование терминала и знание базовых команд bash. Также будут востребованы навыки программирования на языке Python 3. Сомневающимся рекомендуем пройти курсы Введение в Linux и Программирование на Python.
Для выполнения практических заданий понадобится физическая или виртуальная машина с ОС Linux 64x с ядром версии 3.10 или выше, мы рекомендуем развернуть виртуальную машину Ubuntu с использованием VirtualBox.