Бакалавриат
2021/2022
Дополнительные главы прикладной статистики
Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Статус:
Курс по выбору (Прикладная математика и информатика)
Направление:
01.03.02. Прикладная математика и информатика
Где читается:
Факультет компьютерных наук
Когда читается:
3-й курс, 3, 4 модуль
Формат изучения:
без онлайн-курса
Охват аудитории:
для всех кампусов НИУ ВШЭ
Язык:
русский
Кредиты:
6
Контактные часы:
80
Программа дисциплины
Аннотация
Курс Дополнительные главы прикладной статистики в машинном обучении составлен для студентов, обучающихся по программе "Прикладная математика и информатика", желающих детально изучить некоторые аспекты прикладной статистики, необходимые при работе с алгоритмами машинного обучения. В курсе рассмотрены как базовые вопросы статистического анализа: построение многомерных доверительных интервалов, тестирование гипотез в условиях мешающих параметров, регрессионный и дисперсионный анализ на нестандартных данных, так и современные методы, позволяющие значительно улучшить анализ данных (такие как семплирование на основе марковских цепей или методы вариационного вывода). Также курс затрагивает некоторые современные методы регресионного анализа: регрессия на основе гауссовых процессов, байесовские регрессии и обобщённые линейные модели.
Цель освоения дисциплины
- Развитие навыков вывода в многомерных данных.
- Ознакомление с основными подходами к интерпретации вероятности
- Формирование навыков простейшего анализа многомерных данных
- Обучение базовым понятиям работы с распределениями плотности вероятностей
- Обучение продвинутым алгоритмам семплирования многомерных данных
Планируемые результаты обучения
- Анализирует правильность применения кросс-валидации
- Анализирует результаты эксперимента
- Аргументирует выбор метрики для распределения вероятности
- Аргументирует выбор способа оценки мешающих параметров.
- Выявляет оптимальный метод семплирования
- Доказывает неравенства между метриками
- Использует гауссовские процессы для построения суррогатных моделей
- Оценивает устойчивость решения
- Понимает проблемы множественного тестирования
- Предлагает коррекции для оценки величин кроссвалидацией
- Применяет апостериорную коррекцию результатов
- Применяет байесовский вывод для построения доверительных интервалов
- Применяет марковские цепи для многомерного байесовского вывода
- Применяет частотный вывод для построения доверительных интервалов
- Рассчитывает коррекцию на множественные тестирования
Содержание учебной дисциплины
- Байесовский и частотный выводы
- Дисперсионный и регрессионный анализы
- Статистика машинного обучения
- Семплирование
- Гауссовские процессы
Элементы контроля
- Домашнее задание 1
- Домашнее задание 2
- Домашнее задание 3
- Домашнее задание 4
- Коллоквиум
- Письменный экзамен
Промежуточная аттестация
- 2021/2022 учебный год 4 модуль0.2 * Домашнее задание 4 + 0.1 * Письменный экзамен + 0.2 * Домашнее задание 1 + 0.2 * Домашнее задание 2 + 0.1 * Коллоквиум + 0.2 * Домашнее задание 3
Список литературы
Рекомендуемая основная литература
- A first course in Bayesian statistical methods, Hoff, P. D., 2009
- Agresti, A. (2013). Categorical Data Analysis (Vol. Third edition). Hoboken, NJ: Wiley. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=769330
- Computer age statistical inference : algorithms, evidence, and data science, Efron, B., 2017
- Gelman, A. B., & Hill, J. (2015). Data analysis using regression and multilevel/hierarchical models. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsbas&AN=edsbas.4E4FBAE7
- Gelman, A., & Hill, J. (2007). Data Analysis Using Regression and Multilevel/Hierarchical Models. Cambridge University Press.
- Hastie, T., Tibshirani, R., & Friedman, J. H. (2009). The Elements of Statistical Learning : Data Mining, Inference, and Prediction (Vol. Second edition, corrected 7th printing). New York: Springer. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=277008
- Trevor Hastie, Robert Tibshirani, & Jerome Friedman. New York. (n.d.). Book Reviews 567 The Elements of Statistical Learning: Data Mining, Inference, and Prediction. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsbas&AN=edsbas.45E1D521
- Yudi Pawitan, In All Likelihood: Statistical Modelling and Inference Using Likelihood, Oxford University Press (2019) Persistent link to this record (Permalink): http://search.ebscohost.com/login.aspx?direct=true&db=edspub&AN=edp2267145&site=pfi-live
- Глубокое обучение, Гудфеллоу, Я., 2018
- Наглядная математическая статистика : учеб. пособие для вузов, Лагутин, М. Б., 2019
Рекомендуемая дополнительная литература
- All of statistics : a concise course in statistical inference, Wasserman, L., 2004
- Handbook of Markov Chain Monte Carlo (Chapman & Hall/CRC Handbooks of Modern Statistical Methods) ISBN: 978-1-4200-7941-8, editor Brooks, Steve
- The Bayesian way : introductory statistics for economists and engineers, Nyberg, S. O., 2019
- Гауссовские случайные процессы, Ибрагимов, И. А., 1970
- Питербарг, В. И. Двадцать лекций о гауссовских процессах : учебное пособие / В. И. Питербарг. — 2-е изд., доп. — Москва : МЦНМО, 2015. — 189 с. — ISBN 978-5-4439-2404-5. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/71825 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.