Бакалавриат
2021/2022
Прикладная статистика в машинном обучении
Статус:
Курс по выбору (Прикладная математика и информатика)
Направление:
01.03.02. Прикладная математика и информатика
Где читается:
Факультет компьютерных наук
Когда читается:
3-й курс, 1, 2 модуль
Формат изучения:
без онлайн-курса
Охват аудитории:
для своего кампуса
Преподаватели:
Демешев Борис Борисович,
Касьянова Ксения Алексеевна,
Омелюсик Владимир Степанович,
Рябенко Евгений Алексеевич
Язык:
русский
Кредиты:
5
Контактные часы:
60
Программа дисциплины
Аннотация
Курс “Прикладная статистика в машинном обучении” составлен для студентов 3-го курса ОП ПМИ. Основная задача курса – познакомить студентов с многообразием статистических инструментов, которые используются для моделирования и анализа явлений, возникающих в прикладных задачах в различных областях. Особое внимание будет уделено регрессионному анализу, обсуждению моделей, учитывающих тип и специфические особенности данных (например, гетероскедастичность или эндогенность), методам проверки гипотез и корректной интерпретации результатов. Курс будет полезен всем, кто хочет научиться построению интерпретируемых статистических моделей для проведения эмпирических исследований.
Цель освоения дисциплины
- ознакомить студентов с базовыми статистическими методами
- сформировать у студентов навыки работы с данными и решения прикладных задач
Планируемые результаты обучения
- Уметь выбирать спецификацию модели, подходящую для учета выявленных особенностей.
- Уметь выявлять особенности данных, которые могут повлиять на результаты оценки моделей, при помощи различных статистических тестов.
- Уметь задавать и оценивать статистические модели, а также интерпретировать их результаты.
- Уметь использовать универсальные статистические инструменты (например, бутстрэп).
- Уметь получать точечные и интервальные оценки, задавать и тестировать гипотезы.
Содержание учебной дисциплины
- Энтропия и дивергенция Кульбака-Лейблера, AIC
- Метод максимального правдоподобия
- Тесты LR, LM, W
- EM-алгоритм
- Бутстрэп
- Нормальное распределение, t-распределение, хи-квадрат распределение, F-распределение. F-тест.
- Гетероскедастичность и бутстрэп
- Нестандартные регрессии
- Непараметрическое оценивание (таблицы сопряжённости, категориальные переменные)
- Байесовский подход. Байесовский фактор
- Алгоритм Метрополиса-Гастингса
- Variational Inference
Элементы контроля
- Контрольная работа (мидтерм)
- Домашняя работа 1
- Домашняя работа 2
- Экзамен
- КвизыПроверочные работы на семинаре.
Промежуточная аттестация
- 2021/2022 учебный год 2 модуль0.4 * Экзамен + 0.24 * Контрольная работа (мидтерм) + 0.12 * Домашняя работа 1 + 0.12 * Квизы + 0.12 * Домашняя работа 2
Список литературы
Рекомендуемая основная литература
- An Introduction to the Bootstrap, Efron, B., 1993
- Наглядная математическая статистика : учеб. пособие для вузов, Лагутин, М. Б., 2019
- Прикладная математическая статистика : для инженеров и научных работников, Кобзарь, А. И., 2006
- Прикладная статистика в задачах и упражнениях : учебник для вузов, Айвазян, С. А., 2001
- Теория случайных процессов, Булинский, А. В., 2003
- Эконометрика : учеб. пособие для вузов, Айвазян, С. А., 2010
Рекомендуемая дополнительная литература
- Hastie, T., Tibshirani, R., & Friedman, J. H. (2009). The Elements of Statistical Learning : Data Mining, Inference, and Prediction (Vol. Second edition, corrected 7th printing). New York: Springer. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=277008
- Shay Cohen. (2019). Bayesian Analysis in Natural Language Processing : Second Edition. San Rafael: Morgan & Claypool Publishers. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=2102157
- Методы эконометрики : учебник для вузов, Айвазян, С. А., 2010