Управление вычислениями

Play
Current Time 0:00
/
Duration Time 0:00
Remaining Time -0:00
Stream TypeLIVE
Loaded: 0%
Progress: 0%
00:00
Fullscreen
00:00
Mute
Playback Rate
  • 2x
  • 1.75x
  • 1.5x
  • 1.25x
  • 1x
  • 0.75x
  • 0.5x
1
Chapters
  • Chapters
Your browser does not support mp4g
please install flash player
or just download video file below ⤓
To watch this video please visit https://stepik.org/lesson//step/

About the course

Технические аспекты анализа данных зачастую влияют на качество получаемых результатов. В последние годы в центре внимания находятся вопросы обеспечения воспроизводимости и автоматизации анализа – попытки воспроизвести результаты, полученные той или иной группой, часто проваливаются, а анализ больших массивов данных нередко проводится с использованием подручных средств.

Курс состоит из трех модулей, в которых рассматриваются Linux контейнеры и Docker (первый модуль), а также различные подходы к автоматизации процесса вычислений и инструменты, реализующие эти подходы (второй и третий модули). Использование этих инструментов позволяет сделать процесс анализа более воспроизводимым и эффективным.

Instructors

  1. User picture
    Anton Bragin
    Pазработчик в компании JetBrains
    Выпускник Новосибирского государственного университета, кандидат биологических наук. В разное время занимался разработкой наборов для молекулярно-генетической диагностики, автоматизацией лабораторного анализа, созданием алгоритмов и ПО для анализа данных высокопроизводительного секвенирования. Интересуюсь взаимопроникновением точных, естественных и гуманитарных дисциплин и методологическими аспектами разработки.
  2. User picture
    Sergei Mozgov
    Инженер ИТ-инфраструктуры, Parseq Lab
    С отличием закончил ОрелГТУ по направлению “Информационные системы”. Имею степень кандидата технических наук по специальности 051306 “Автоматизация технологических процессов и производств”. Занимался промышленной автоматизацией и задачами управления вычислительными системами. Есть опыт работы в роли системного инженера. В биоинформатику пришел в 2014 году. Занимаюсь проектами по анализу данных в области Life Science с использованием High Performance и Cloud Computing. Интересуюсь всем, что поможет ученым (биоинформатикам, биологам, химикам и тд.) эффективнее анализировать данные.

Reviews

Сергей Данилов January 6, 2018
Rated:  5
Отличный курс для любителей "похакать пентагон". Да, RTFM, соглашусь. Да, опыт линуксоида/скрипт-кидди приветствуется до уровня необходимости. Но не соглашусь что база не преподана. Да и вообще, на мой взгляд тут даже не совсем RTFM, всё-таки, а скорее "обучение плаванию путём катапультирования в центр водоёма" - и это полезнее, чем "обезьянка видит - обезьянка делает". То, что нужно знание конкретной прикладной области (генетика) - это неправда, все необходимые команды выданы в условиях, задача только сплести из них пайплайны по тому или иному рецепту для той или иной пайплайнилки.
Vladimir Komarov January 2, 2018
Rated:  3
Курс средней сложности, требует небольшой подготовки при прохождении. Некоторые темы раскрыты поверхностно, а задания по ним не соответствуют по сложности. Требуется в значительной степени ориентироваться на гугление нежели на лекции. Задачи описаны сложно и неполно, некоторые требуют знания предмета.
Rated:  3
RTFM, мазафака. Видео по snakemake скорее бесполезны, чем полезны. Тема курса интересная, полезная, хайповая, но создатели, к сожалению, поленились давать объяснения сложных моментов и сосредоточили внимание на рисовании овалов. Полезен ли курс в целом? Без сомнения! Полезны ли объяснения, которые даются в курсе? Скорее нет, чем да.
Play
Current Time 0:00
/
Duration Time 0:00
Remaining Time -0:00
Stream TypeLIVE
Loaded: 0%
Progress: 0%
00:00
Fullscreen
00:00
Mute
Playback Rate
  • 2x
  • 1.75x
  • 1.5x
  • 1.25x
  • 1x
  • 0.75x
  • 0.5x
1
Chapters
  • Chapters
Your browser does not support mp4g
please install flash player
or just download video file below ⤓
To watch this video please visit https://stepik.org/lesson//step/
4.4 All reviews

Курс посвящен изучению инструментария для работы с данными, автоматизации анализа и обеспечению воспроизводимости.

Expected time to complete:
22 hours
Language:
Русский
Certificate:
is issued
Certificate condition: 110 points
With distinction: 125 points

About the course

Технические аспекты анализа данных зачастую влияют на качество получаемых результатов. В последние годы в центре внимания находятся вопросы обеспечения воспроизводимости и автоматизации анализа – попытки воспроизвести результаты, полученные той или иной группой, часто проваливаются, а анализ больших массивов данных нередко проводится с использованием подручных средств.

Курс состоит из трех модулей, в которых рассматриваются Linux контейнеры и Docker (первый модуль), а также различные подходы к автоматизации процесса вычислений и инструменты, реализующие эти подходы (второй и третий модули). Использование этих инструментов позволяет сделать процесс анализа более воспроизводимым и эффективным.

Requirements

От учащихся потребуются  навыки работы с операционной системой Linux, в том числе уверенное использование терминала и знание базовых команд bash. Также будут востребованы  навыки программирования на языке Python 3. Сомневающимся рекомендуем пройти курсы Введение в Linux и Программирование на Python.

Для выполнения практических заданий понадобится физическая или виртуальная машина с ОС Linux 64x с ядром версии 3.10 или выше, мы рекомендуем развернуть виртуальную машину Ubuntu с использованием VirtualBox.

This course is entirely free. All content is available now.