EMBER_CLI_FASTBOOT_BODY

Анализ данных в R. Часть 2

The course meets the formal recommendations of Stepik
Play
To watch this video please visit https://stepik.org/lesson//step/

About the course

В первой части курса по анализу данных в R мы познакомились с основными этапами анализа данных в R: предобработка данных, применение статистических тестов, визуализация и презентация результатов анализа. В этом курсе мы углубимся во все вышеперечисленные этапы: научимся быстро и эффективно манипулировать с данными при помощи функций семейства apply и таких пакетов как dplyr и data.table. Мы более подробно обсудим процесс визуализации данных при помощи пакета ggplot2, а также научимся строить интерактивные графики. В последнем модуле курса мы поговорим о работе в R Markdown для создания отчетов о проделанной в R работе.

Instructors

  1. User picture
    Anatoliy Karpov
    Saint Petersburg State University, Bioinformatics Institute, Vkontakte
    I graduated from St. Petersburg State University (SPSU). As a cognitive psychologist I studied processes of human learning. My interest in the application of computational methods in psychology led me to the field of statistics, programming and machine learning. Now I am a data scientist in Vkontakte the biggest social network in Russia. I am also a lecturer on biostatistics and R programming in the Bioinformatics Institute.
  2. Разрабатываю рекомендательные системы и занимаюсь бизнес-аналитикой (проверкой гипотез, получение инсайтов из данных). Имею опыт работы с R и Python; Spark, Hive.
  3. Кандидат физико-математических наук, специальность -- численные методы, теория вероятностей, математическая статистика. Профессионально занимаюсь количественными методами финансовой математики (quant finance) и разработкой программного обеспечения. Энтузиаст open source и языка R, организатор St. Petersburg R user group.

Reviews

Rated:  5
Превосходный курс, Превосходные преподаватели!!!
Rated:  5
Как всегда, замечательно!!! Интересно, доступно и очень полезно!!!!
Andrey Panchenko June 12, 2018 link
Rated:  4
Здравствуйте преподаватели и выпускники)) Хочу отметить что данный курс по уровню знаний очень хорош, но я бы хотел отметить следующее: 1. Анатолий Карпов - красавчик! Толя, очень качественно и доступно спасибо тебе огромное! 2. Владислав очень мало материала и мало практики по data.table а по plotly итого меньше. Надеюсь что будут последующие курсы с боле развернутыми примерами и большим количеством практических занятий. 3. Антон, хочется больше практических чем теоретических примеров. В целом курс очень хорош, помогает решать некоторые достаточно насущные проблемы. Если Ваша команда планирует курс по R3 то очень хотелось бы увидеть RandomForest, Xgboost и т.д. Спасибо вам ребята за то, что делитесь своими знаниями!
Play
To watch this video please visit https://stepik.org/lesson//step/
4.8 All reviews

Курс продолжает знакомить слушателей с использованием R для анализа данных. В этом курсе мы разберем несколько продвинутых тем, которые не были рассмотрены в первой части: предобработка данных при помощи пакетов data.table и dplyr, продвинутые приемы визуализации, работа в R Markdown.

Workload:
3 - 5 часов в неделю
Expected time to complete:
26 hours
Language:
Русский
Certificate:
Институт биоинформатики
Certificate details
Certificate condition: 90 points
With distinction: 105 points

About the course

В первой части курса по анализу данных в R мы познакомились с основными этапами анализа данных в R: предобработка данных, применение статистических тестов, визуализация и презентация результатов анализа. В этом курсе мы углубимся во все вышеперечисленные этапы: научимся быстро и эффективно манипулировать с данными при помощи функций семейства apply и таких пакетов как dplyr и data.table. Мы более подробно обсудим процесс визуализации данных при помощи пакета ggplot2, а также научимся строить интерактивные графики. В последнем модуле курса мы поговорим о работе в R Markdown для создания отчетов о проделанной в R работе.

Requirements

Для успешного прохождения курса необходимы базовые знания работы в R на уровне курса Анализ данных в R. Мы также не будем останавливаться на статистических вопросах, убедитесь, что вы владеете темой на уровне курсов Основы статистики и Основы статистики. Часть 2.

Некоторые темы, которые будут обсуждаться в этом курсе в прикладном ключе, разобраны более подробно с точки зрения программирования в курсе Антона Антонова Основы программирования в R.

Target audience

Студенты и научные работники всех специальностей, школьники старших классов.

This course is entirely free. All content is available now.