2022/2023
Статистика для анализа данных
Статус:
Маго-лего
Кто читает:
Базовая кафедра Института биоорганической химии им. академиков М.М. Шемякина и Ю.А. Овчинникова РАН
Когда читается:
2 модуль
Онлайн-часы:
28
Охват аудитории:
для всех кампусов НИУ ВШЭ
Преподаватели:
Жиянов Антон Павлович
Язык:
русский
Кредиты:
3
Контактные часы:
2
Программа дисциплины
Аннотация
Курс охватывает все основные статистические концепции. В первой половине курса слушатели знакомятся с основными понятиями из математической статистики и нарабатывают необходимый для их понимания бэкграунд из теории вероятностей. Слушатели научатся делать описательный анализ данных, визуализировать данные и исследовать линейные взаимосвязи.
Вторая часть посвящена более продвинутым темам: параметрическим и непараметрическим тестам, принципу проверки статистических гипотез, а также построению прогностических моделей на основе линейной и логистической регрессии. Кроме того, в течение курса демонстрируется представление результатов анализа данных в графическом виде: рассматриваются как самые простые и классические методы визуализации, так и более сложные.
Цель освоения дисциплины
- Целью курса является получение компетенции "применение математического аппарата для решения задач по оценке и разработки моделей" в соответствии с Рекомендациями к дополнительным профессиональным программам ИТ-профиля, реализуемым в рамках проекта «Цифровые кафедры» университета–участника программы стратегического академического лидерства «Приоритет-2030».
Планируемые результаты обучения
- Оперирует основными понятиями статистики.
- Загружает и исследует данные в выбранном ПО.
- Проводит описательный анализ данных.
- Выбирает корректный тип визуализации и умеет визуализировать данные.
- Определяет тип распределения по визуализации и интерпретирует его.
- Определяет силу и направление корреляции по коэффициенту и визуализации. Умеет интерпретировать корреляцию в данных.
- Строит линейный тренд в данных и интерпретирует его уравнение.
- Выдвигает гипотезу, выбирает критерий значимости и корректный параметрический или непараметрический тест для проверки гипотезы.
- Рассчитывает и интерпретирует критерий Стьюдента для разных выборок.
- Применяет к данным модель линейной регрессии и интерпретирует ее метрики и коэффициенты. Умеет проверить ограничения и допущения для построения такой модели.
- Применяет к данным модель логистической регрессии и интерпретирует ее метрики и коэффициенты. Умеет проверить ограничения и допущения для построения такой модели
Содержание учебной дисциплины
- Тема 1.
- Тема 2.
- Тема 3.
- Тема 4.
- Тема 5.
- Тема 6.
- Тема 7.
- Тема 8.
- Тема 9.
- Тема 10.
- Тема 11.
- Тема 12.
- Тема 13.
- Тема 14.
Промежуточная аттестация
- 2022/2023 учебный год 2 модуль0.5 * Практические задание + 0.5 * Финальный тест