EMBER_CLI_FASTBOOT_BODY

Анализ данных в R. Часть 2

Курс продолжает знакомить слушателей с использованием R для анализа данных. В этом курсе мы разберем несколько продвинутых тем, которые не были рассмотрены в первой части: предобработка данных при помощи пакетов data.table и dplyr, продвинутые приемы визуализации, работа в R Markdown.

3 - 5 часов в неделю
Certificate Stepik

About this course

В первой части курса по анализу данных в R мы познакомились с основными этапами анализа данных в R: предобработка данных, применение статистических тестов, визуализация и презентация результатов анализа. В этом курсе мы углубимся во все вышеперечисленные этапы: научимся быстро и эффективно манипулировать с данными при помощи функций семейства apply и таких пакетов как dplyr и data.table. Мы более подробно обсудим процесс визуализации данных при помощи пакета ggplot2, а также научимся строить интерактивные графики. В последнем модуле курса мы поговорим о работе в R Markdown для создания отчетов о проделанной в R работе.

Who is this course for

Студенты и научные работники всех специальностей, школьники старших классов.

Для успешного прохождения курса необходимы базовые знания работы в R на уровне курса Анализ данных в R. Мы также не будем останавливаться на статистических вопросах, убедитесь, что вы владеете темой на уровне курсов Основы статистики и Основы статистики. Часть 2.

Некоторые темы, которые будут обсуждаться в этом курсе в прикладном ключе, разобраны более подробно с точки зрения программирования в курсе Антона Антонова Основы программирования в R.

Meet the Instructors

User picture
Anatoliy Karpov
Saint Petersburg State University, Bioinformatics Institute, VK
I graduated from St. Petersburg State University. As a cognitive psychologist I studied processes of human learning. My interest in the application of computational methods in psychology led me to the field of statistics, programming and machine learning. Now I am a data scientist in VK the biggest social network in Russia. I am also a lecturer on biostatistics and R programming in the Bioinformatics Institute.
User picture
Vladislav Grozin
Разрабатываю рекомендательные системы и занимаюсь бизнес-аналитикой (проверкой гипотез, получение инсайтов из данных). Имею опыт работы с R и Python; Spark, Hive.
User picture
Антон Антонов
Кандидат физико-математических наук, специальность -- численные методы, теория вероятностей, математическая статистика. Профессионально занимаюсь количественными методами финансовой математики (quant finance) и разработкой программного обеспечения. Энтузиаст open source и языка R, организатор St. Petersburg R user group.

Course content

Продвинутая предобработка данных
  1. Общая информация о курсе
  2. Функции семейства apply. Часть 1
  3.  
     
  4.  
     
  5.  
     
  6.  
     
  7.  
     
  8.  
     
  9.  
     
Подробнее о визуализации
R Markdown
Практические задачи

Certificate

Институт биоинформатики

Learners' reviews

Если вы пришли на курс после первой части "Анализа данных в R" и если вам с трудом далась первая часть (допустим, на решение задач уходили целые часы) - готовьтесь к худшему. А про сертификат лучше вообще забыть, потому что набрать требуемые 110 баллов нереально. Просто никто не будет проверять работу, за которую дают целых 15 баллов - преподаватели не хотели это делать изначально, а ученики для peer-review закончились ещё в 2017, см. комментарии к заданию 3.3. А чтобы взять полностью оставшиеся 95 баллов (на сертификат вроде достаточно 90) нужно явно быть программистом по специальности или призванию. Да ещё и дизайнером, умеющим моделировать чайники в 3D. Я вот всего лишь медико-биолог, "ну не шмогла я, не шмогла" :D Тем не менее, я благодарна создателям курса. Не сомневаюсь, что знания об *apply, dplyr и ggplot2 не раз помогут в подготовке статей и диссертаций, а что же до остальных тем курса... ну, я буду знать, что такое тоже есть ;)
Курс мне очень понравился. Буду еще проходить курсы данного коллектива авторов. Рекомендую!
Быстро и доступным языком рассказывают про основные пакеты для работы с данными

Share this course