EMBER_CLI_FASTBOOT_BODY

Анализ данных в R. Часть 2

Play
To watch this video please visit https://stepik.org/lesson//step/

About the course

В первой части курса по анализу данных в R мы познакомились с основными этапами анализа данных в R: предобработка данных, применение статистических тестов, визуализация и презентация результатов анализа. В этом курсе мы углубимся во все вышеперечисленные этапы: научимся быстро и эффективно манипулировать с данными при помощи функций семейства apply и таких пакетов как dplyr и data.table. Мы более подробно обсудим процесс визуализации данных при помощи пакета ggplot2, а также научимся строить интерактивные графики. В последнем модуле курса мы поговорим о работе в R Markdown для создания отчетов о проделанной в R работе.

Instructors

  1. User picture
    Anatoliy Karpov
    Saint Petersburg State University, Bioinformatics Institute, Vkontakte
    I graduated from St. Petersburg State University (SPSU). As a cognitive psychologist I studied processes of human learning. My interest in the application of computational methods in psychology led me to the field of statistics, programming and machine learning. Now I am a data scientist in Vkontakte the biggest social network in Russia. I am also a lecturer on biostatistics and R programming in the Bioinformatics Institute.
  2. Разрабатываю рекомендательные системы и занимаюсь бизнес-аналитикой (проверкой гипотез, получение инсайтов из данных). Имею опыт работы с R и Python; Spark, Hive.
  3. Кандидат физико-математических наук, специальность -- численные методы, теория вероятностей, математическая статистика. Профессионально занимаюсь количественными методами финансовой математики (quant finance) и разработкой программного обеспечения. Энтузиаст open source и языка R, организатор St. Petersburg R user group.

Reviews

Георгий May 16, 2018 link
Rated:  5
Один из наиболее доходчивых и интересных курсов
Rated:  5
Хороший курс. Очень полезна 1 часть, открыл для себя много нового
Rated:  5
Это лучшее, что я видел))
Play
To watch this video please visit https://stepik.org/lesson//step/
4.8 All reviews

Курс продолжает знакомить слушателей с использованием R для анализа данных. В этом курсе мы разберем несколько продвинутых тем, которые не были рассмотрены в первой части: предобработка данных при помощи пакетов data.table и dplyr, продвинутые приемы визуализации, работа в R Markdown.

Workload:
3 - 5 часов в неделю
Expected time to complete:
26 hours
Language:
Русский
Certificate:
Институт биоинформатики
Certificate details
Certificate condition: 90 points
With distinction: 105 points

About the course

В первой части курса по анализу данных в R мы познакомились с основными этапами анализа данных в R: предобработка данных, применение статистических тестов, визуализация и презентация результатов анализа. В этом курсе мы углубимся во все вышеперечисленные этапы: научимся быстро и эффективно манипулировать с данными при помощи функций семейства apply и таких пакетов как dplyr и data.table. Мы более подробно обсудим процесс визуализации данных при помощи пакета ggplot2, а также научимся строить интерактивные графики. В последнем модуле курса мы поговорим о работе в R Markdown для создания отчетов о проделанной в R работе.

Requirements

Для успешного прохождения курса необходимы базовые знания работы в R на уровне курса Анализ данных в R. Мы также не будем останавливаться на статистических вопросах, убедитесь, что вы владеете темой на уровне курсов Основы статистики и Основы статистики. Часть 2.

Некоторые темы, которые будут обсуждаться в этом курсе в прикладном ключе, разобраны более подробно с точки зрения программирования в курсе Антона Антонова Основы программирования в R.

Target audience

Студенты и научные работники всех специальностей, школьники старших классов.

This course is entirely free. All content is available now.