Мы используем файлы cookies для улучшения работы сайта НИУ ВШЭ и большего удобства его использования. Более подробную информацию об использовании файлов cookies можно найти здесь, наши правила обработки персональных данных – здесь. Продолжая пользоваться сайтом, вы подтверждаете, что были проинформированы об использовании файлов cookies сайтом НИУ ВШЭ и согласны с нашими правилами обработки персональных данных. Вы можете отключить файлы cookies в настройках Вашего браузера.

  • A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Магистратура 2021/2022

Прикладная статистика в машинном обучении

Статус: Курс обязательный
Направление: 01.04.02. Прикладная математика и информатика
Когда читается: 1-й курс, 3, 4 модуль
Формат изучения: с онлайн-курсом
Онлайн-часы: 54
Охват аудитории: для своего кампуса
Прогр. обучения: Машинное обучение и высоконагруженные системы (з)
Язык: русский
Кредиты: 6
Контактные часы: 24

Программа дисциплины

Аннотация

Данный курс поможет узнать студентам основы математической статистики, используемые в машинном обучении. В ходе курса студенты будут сами реализовывать основные статистические методы. Курс поможет студентам понимать схемы работы различных методов машинного обучения и даст понимание, как их можно изменять самостоятельно
Цель освоения дисциплины

Цель освоения дисциплины

  • Уметь пользоваться методом максимального правдоподобия
  • Уметь оптимизировать различные функции потерь при помощи ММП
  • Знать и уметь применять основные свойства условного математического ожидания
  • Уметь пользоваться байесовским методом в python
  • Знать основы коэффициентов корреляции
  • Уметь пользоваться непараметрической регрессией
  • Знать основы дисперсионного анализа (ANOVA)
Планируемые результаты обучения

Планируемые результаты обучения

  • Уметь выбирать спецификацию модели, подходящую для учета выявленных особенностей.
  • Уметь выявлять особенности данных, которые могут повлиять на результаты оценки моделей, при помощи различных статистических тестов.
  • Уметь задавать и оценивать статистические модели, а также интерпретировать их результаты.
  • Уметь использовать универсальные статистические инструменты (например, бутстрэп).
  • Уметь получать точечные и интервальные оценки, задавать и тестировать гипотезы.
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Метод максимального правдоподобия
  • Функции потерь и метод максимального правдоподобия
  • Условное математическое ожидание
  • Энтропия и дивергенция Кульбака-Лейблера, AIC
  • Непараметрическое оценивание (таблицы сопряжённости, категориальные переменные)
  • EM-алгоритм
  • Тесты LR, LM, W
  • Нормальное распределение, t-распределение, хи-квадрат распределение, F-распределение. F-тест.
  • Бутстрэп
  • Гетероскедастичность и бутстрэп
  • Нестандартные регрессии
Элементы контроля

Элементы контроля

  • неблокирующий Домашнее задание
  • неблокирующий Контрольная работа
  • неблокирующий Экзамен
    Итог = Округление(0.3 * ДЗ + 0.2 * КР + 0.2 * Э + 0.3 * Coursera), где ДЗ — средняя оценка за все домашние задания, КР — оценка за контрольную работу, Э — оценка за экзамен, Coursera - оценка за задания курса на Coursera Округление арифметическое.
  • неблокирующий Coursera
Промежуточная аттестация

Промежуточная аттестация

  • 2021/2022 учебный год 4 модуль
    0.3 * Coursera + 0.3 * Домашнее задание + 0.2 * Контрольная работа + 0.2 * Экзамен
Список литературы

Список литературы

Рекомендуемая основная литература

  • An Introduction to the Bootstrap, Efron, B., 1993
  • Наглядная математическая статистика : учеб. пособие для вузов, Лагутин, М. Б., 2019
  • Прикладная математическая статистика : для инженеров и научных работников, Кобзарь, А. И., 2006
  • Прикладная статистика в задачах и упражнениях : учебник для вузов, Айвазян, С. А., 2001

Рекомендуемая дополнительная литература

  • Методы эконометрики : учебник для вузов, Айвазян, С. А., 2010