• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
2022/2023

Статистика для анализа данных

Статус: Маго-лего
Когда читается: 2 модуль
Онлайн-часы: 28
Охват аудитории: для всех кампусов НИУ ВШЭ
Преподаватели: Жиянов Антон Павлович
Язык: русский
Кредиты: 3
Контактные часы: 2

Программа дисциплины

Аннотация

Курс охватывает все основные статистические концепции. В первой половине курса слушатели знакомятся с основными понятиями из математической статистики и нарабатывают необходимый для их понимания бэкграунд из теории вероятностей. Слушатели научатся делать описательный анализ данных, визуализировать данные и исследовать линейные взаимосвязи. Вторая часть посвящена более продвинутым темам: параметрическим и непараметрическим тестам, принципу проверки статистических гипотез, а также построению прогностических моделей на основе линейной и логистической регрессии. Кроме того, в течение курса демонстрируется представление результатов анализа данных в графическом виде: рассматриваются как самые простые и классические методы визуализации, так и более сложные.
Цель освоения дисциплины

Цель освоения дисциплины

  • Целью курса является получение компетенции "применение математического аппарата для решения задач по оценке и разработки моделей" в соответствии с Рекомендациями к дополнительным профессиональным программам ИТ-профиля, реализуемым в рамках проекта «Цифровые кафедры» университета–участника программы стратегического академического лидерства «Приоритет-2030».
Планируемые результаты обучения

Планируемые результаты обучения

  • Оперирует основными понятиями статистики.
  • Загружает и исследует данные в выбранном ПО.
  • Проводит описательный анализ данных.
  • Выбирает корректный тип визуализации и умеет визуализировать данные.
  • Определяет тип распределения по визуализации и интерпретирует его.
  • Определяет силу и направление корреляции по коэффициенту и визуализации. Умеет интерпретировать корреляцию в данных.
  • Строит линейный тренд в данных и интерпретирует его уравнение.
  • Выдвигает гипотезу, выбирает критерий значимости и корректный параметрический или непараметрический тест для проверки гипотезы.
  • Рассчитывает и интерпретирует критерий Стьюдента для разных выборок.
  • Применяет к данным модель линейной регрессии и интерпретирует ее метрики и коэффициенты. Умеет проверить ограничения и допущения для построения такой модели.
  • Применяет к данным модель логистической регрессии и интерпретирует ее метрики и коэффициенты. Умеет проверить ограничения и допущения для построения такой модели
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Тема 1.
  • Тема 2.
  • Тема 3.
  • Тема 4.
  • Тема 5.
  • Тема 6.
  • Тема 7.
  • Тема 8.
  • Тема 9.
  • Тема 10.
  • Тема 11.
  • Тема 12.
  • Тема 13.
  • Тема 14.
Элементы контроля

Элементы контроля

  • неблокирующий Практические задание
  • неблокирующий Финальный тест
Промежуточная аттестация

Промежуточная аттестация

  • 2022/2023 учебный год 2 модуль
    0.5 * Практические задание + 0.5 * Финальный тест
Список литературы

Список литературы

Рекомендуемая основная литература

  • Python и анализ данных, Маккинли, У., 2015
  • Statistica 6. Статистический анализ данных : учеб. пособие для вузов, Халафян, А. А., 2008

Рекомендуемая дополнительная литература

  • Анализ данных на компьютере, Тюрин, Ю. Н., 2003

Авторы

  • Поликанова Ирина Сергеевна
  • Яхина Мария Рафаиловна