• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
2020/2021

Программирование для анализа данных и воспроизводимые исследования

Лучший по критерию «Полезность курса для Вашей будущей карьеры»
Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Лучший по критерию «Новизна полученных знаний»
Статус: Майнор
Когда читается: 1, 2 модуль
Преподаватели: Булыгин Денис Игоревич, Суворова Алёна Владимировна, Сущевский Всеволод Вячеславович
Язык: русский
Кредиты: 5
Контактные часы: 56

Программа дисциплины

Аннотация

Курс посвящен развитию базовых навыков работы с инструментальным средствам анализа данных и технологиям обработки данных. Курс дополняет и расширяет знания в области прикладной статистики и демонстрирует применения традиционных статистических методов (тестов) к различным задачам. Итогом курса является наличие у студентов навыков обработки уже собранных данных, а так же базовые навыки сбора данных.
Цель освоения дисциплины

Цель освоения дисциплины

  • Целями освоения дисциплины «Программирование для анализа данных и воспроизводимые исследования» являются изучение особенностей различных методов сбора и агрегации данных, формирование навыков планирования сбора и обработки данных, изучение пакетов ориентированных на основные этапы подготовки данных и их анализа.
Планируемые результаты обучения

Планируемые результаты обучения

  • Знает основные понятия языка R
  • Создает отчеты с помощью RMarkdown
  • Владеет инструментарием визуализации и агрегации данных в R
  • Выбирает тип графика в зависимости от задачи
  • Анализирует данные в формате дат и текста на языке R
  • Строит модели деревьев решений
  • Интерпретирует и визуализирует результаты моделей
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Воспроизводимые исследования
    Область науки о данных. Воспроизводимые исследования. Создание отчетов и язык разметки RMarkdown. Введение в язык программирования R
  • Статистическое обучение. Введение в клиентскую аналитику
    Вычислительная статистика и статистическое обучение в бизнесе, социологии, экономике. Деревья решений. Тестирование статистических гипотез. Клиентская аналитика
  • Разведывательный анализ данных
    Визуализация и агрегация данных. Работа с датами и текстовыми данными
Элементы контроля

Элементы контроля

  • неблокирующий контрольная работа №1
  • неблокирующий контрольная работа №2
  • неблокирующий домашнее задание №1
    Домашнее задание представляет собой программный проект по анализу данных. Данные для задания и вопросы, на которые нужно дать ответы, предоставляются преподавателем. Работа выполняется индивидуально. Проект должен быть написан с ориентацией на “заказчика”, то есть понятен потенциальному клиенту, содержать все необходимые пояснения и интерпретации. Результаты представляются в виде 1) дашборда с таблицами / графиками по предоставленному преподавателем шаблону, и 2) отчета-пояснения, какие выводы должен сделать пользователь и какие элементы фокусируют внимание именно на этих выводах.
  • неблокирующий домашнее задание №2
    Домашнее задание представляет собой программный проект по анализу данных. Данные для задания предоставляются преподавателем. Работа выполняется индивидуально. Проект должен быть написан с ориентацией на “заказчика”, то есть понятен потенциальному клиенту, содержать все необходимые пояснения и интерпретации. Результаты представляются в виде одного из двух вариантов по выбору преподавателя: 1) полноценный отчет о результатах анализа, 2) дашборд с таблицами / графиками, показывающими результаты предсказания в определенных группах и результаты сравнения групп с помощью проверки гипотез, и отчет-пояснение к дашборду.
  • неблокирующий упражнения
Промежуточная аттестация

Промежуточная аттестация

  • Промежуточная аттестация (2 модуль)
    0.15 * домашнее задание №1 + 0.15 * домашнее задание №2 + 0.2 * контрольная работа №1 + 0.2 * контрольная работа №2 + 0.3 * упражнения
Список литературы

Список литературы

Рекомендуемая основная литература

  • Мастицкий С.Э., Шитиков В.К. - Статистический анализ и визуализация данных с помощью R - Издательство "ДМК Пресс" - 2015 - 496с. - ISBN: 978-5-97060-301-7 - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/73072

Рекомендуемая дополнительная литература

  • Wickham, H., & Grolemund, G. (2016). R for Data Science : Import, Tidy, Transform, Visualize, and Model Data (Vol. First edition). Sebastopol, CA: Reilly - O’Reilly Media. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1440131