Магистратура
2021/2022





Прикладная статистика в машинном обучении
Статус:
Курс обязательный
Направление:
01.04.02. Прикладная математика и информатика
Где читается:
Факультет компьютерных наук
Когда читается:
1-й курс, 3, 4 модуль
Формат изучения:
с онлайн-курсом
Онлайн-часы:
54
Охват аудитории:
для своего кампуса
Преподаватели:
Аброскин Илья Дмитриевич
Прогр. обучения:
Машинное обучение и высоконагруженные системы (з)
Язык:
русский
Кредиты:
6
Контактные часы:
24
Программа дисциплины
Аннотация
Данный курс поможет узнать студентам основы математической статистики, используемые в машинном обучении. В ходе курса студенты будут сами реализовывать основные статистические методы. Курс поможет студентам понимать схемы работы различных методов машинного обучения и даст понимание, как их можно изменять самостоятельно
Цель освоения дисциплины
- Уметь пользоваться методом максимального правдоподобия
- Уметь оптимизировать различные функции потерь при помощи ММП
- Знать и уметь применять основные свойства условного математического ожидания
- Уметь пользоваться байесовским методом в python
- Знать основы коэффициентов корреляции
- Уметь пользоваться непараметрической регрессией
- Знать основы дисперсионного анализа (ANOVA)
Планируемые результаты обучения
- Уметь выбирать спецификацию модели, подходящую для учета выявленных особенностей.
- Уметь выявлять особенности данных, которые могут повлиять на результаты оценки моделей, при помощи различных статистических тестов.
- Уметь задавать и оценивать статистические модели, а также интерпретировать их результаты.
- Уметь использовать универсальные статистические инструменты (например, бутстрэп).
- Уметь получать точечные и интервальные оценки, задавать и тестировать гипотезы.
Содержание учебной дисциплины
- Метод максимального правдоподобия
- Функции потерь и метод максимального правдоподобия
- Условное математическое ожидание
- Энтропия и дивергенция Кульбака-Лейблера, AIC
- Непараметрическое оценивание (таблицы сопряжённости, категориальные переменные)
- EM-алгоритм
- Тесты LR, LM, W
- Нормальное распределение, t-распределение, хи-квадрат распределение, F-распределение. F-тест.
- Бутстрэп
- Гетероскедастичность и бутстрэп
- Нестандартные регрессии
Элементы контроля
- Домашнее задание
- Контрольная работа
- ЭкзаменИтог = Округление(0.3 * ДЗ + 0.2 * КР + 0.2 * Э + 0.3 * Coursera), где ДЗ — средняя оценка за все домашние задания, КР — оценка за контрольную работу, Э — оценка за экзамен, Coursera - оценка за задания курса на Coursera Округление арифметическое.
- Coursera
Промежуточная аттестация
- 2021/2022 учебный год 4 модуль0.3 * Coursera + 0.3 * Домашнее задание + 0.2 * Контрольная работа + 0.2 * Экзамен
Список литературы
Рекомендуемая основная литература
- An Introduction to the Bootstrap, Efron, B., 1993
- Наглядная математическая статистика : учеб. пособие для вузов, Лагутин, М. Б., 2019
- Прикладная математическая статистика : для инженеров и научных работников, Кобзарь, А. И., 2006
- Прикладная статистика в задачах и упражнениях : учебник для вузов, Айвазян, С. А., 2001
Рекомендуемая дополнительная литература
- Методы эконометрики : учебник для вузов, Айвазян, С. А., 2010