2024/2025
Анализ данных с временной структурой
Статус:
Маго-лего
Когда читается:
3, 4 модуль
Охват аудитории:
для своего кампуса
Преподаватели:
Соколовский Евгений Игоревич
Язык:
русский
Кредиты:
6
Программа дисциплины
Аннотация
В рамках курса будут разобраны как стандартные методы раешения задачи регрессии на данных с временной структурой (SARIMA/ARCH и т.п.), так и методы, позволяющие проводить более глубокий анализ (Monte Carlo Marcov Chain, использование информационной теории для отбора значимых факторов, методы решения задач поиска разладок и аномалий в данных, и, как итог, принципы построения автоматизированного пайплайна для прогнозирования). В рамках курса будет выполнено 2 командных проекта, основанных на реальных банковских кейсах, посвященных решению задачи прогнозирования стандартными авторегрессионными моделями и автоматизации прогнозирования на данных с нестационарной структурой.
Цель освоения дисциплины
- Получение необходимых для практической работы с данными с временной структурой знаний и навыков;
- Изучение основных моделей авторегрессионного анализа;
- Изучение основы подготовки данных для моделей машинного обучения и связанной с этим информационной теории;
- Изучение особенностей автоматизации прогнозирования;
- Рассмотрение методов, идеологически близкие к Байесовским, для задач, не подразумевающих точного прогноза.
Планируемые результаты обучения
- Освоить основные модели авторегрессионного анализа
- Освоить основы подготовки данных для моделей машинного обучения и связанной с этим информационной теории
- Освоить особенности автоматизации прогнозирования
- Понять методы, идеологически близкие к Байесовским, для задач, не подразумевающих точного прогноза
- Обладать навыками, необходимых для практической работы с данными с временной структурой
Содержание учебной дисциплины
- Гауссовские линейные авторегрессионные модели. Основные понятия. AR, ARMA, ARIMA, SARIMA, ARCH, GARCH. Свойства, подбор параметров, проверка корректности
- Построение автоматизированного пайплайна для решения задачи регрессии на данных с временной структурой. Компоненты. Особенности. Проверка эффективности
- Задача выявления аномалий в данных с временной структурой. Задача выявления разладки временного ряда
- Построение признакового пространства. Основные понятия задачи выделения значимых факторов
- Фильтрационные методы выделения значимых факторов. Начала информационной теории. Совместная информация, трансфертная энтропия
- Марковские цепи. Monte Carlo Markov Chain.
- Фильтр Калмана
Элементы контроля
- Командный проект 1
- Контрольная работа
- ЭкзаменУстный опрос по всему пройденному материалу
- Командный проект 2
Промежуточная аттестация
- 2024/2025 4th module0.35 * Командный проект 1 + 0.35 * Командный проект 2 + 0.1 * Контрольная работа + 0.2 * Экзамен
Список литературы
Рекомендуемая основная литература
- Вероятность и статистика в примерах и задачах. Т. 2: Марковские цепи как отправная точка теории случайных процессов и их приложения, Кельберт, М. Я., 2010
- Многомерная статистика: гауссовские линейные модели, Тюрин, Ю. Н., 2011
- Подкорытова, О. А. Анализ временных рядов : учебное пособие для бакалавриата и магистратуры / О. А. Подкорытова, М. В. Соколов. — 2-е изд., перераб. и доп. — Москва : Издательство Юрайт, 2019. — 267 с. — (Бакалавр и магистр. Модуль). — ISBN 978-5-534-02556-9. — Текст : электронный // Образовательная платформа Юрайт [сайт]. — URL: https://urait.ru/bcode/433180 (дата обращения: 28.08.2023).
Рекомендуемая дополнительная литература
- Гауссовские случайные процессы, Ибрагимов, И. А., 1970
- Дауни, А. Б. Байесовские модели / А. Б. Дауни , перевод с английского В. А. Яроцкого. — Москва : ДМК Пресс, 2018. — 182 с. — ISBN 978-5-97060-664-3. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/131695 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
- Эконометрика. Элементарные методы и введение в регрессионный анализ временных рядов, Носко, В. П., 2004