Магистратура
2022/2023
Научно-исследовательский семинар "Прикладные задачи анализа данных"
Лучший по критерию «Полезность курса для Вашей будущей карьеры»
Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Лучший по критерию «Новизна полученных знаний»
Статус:
Курс обязательный (Машинное обучение и высоконагруженные системы)
Направление:
01.04.02. Прикладная математика и информатика
Где читается:
Факультет компьютерных наук
Когда читается:
2-й курс, 1 модуль
Формат изучения:
без онлайн-курса
Охват аудитории:
для своего кампуса
Преподаватели:
Гущин Михаил Иванович,
Кантонистова Елена Олеговна,
Рябинин Максим Константинович,
Садртдинов Ильдус Рустемович,
Цвигун Аким Олегович
Прогр. обучения:
Машинное обучение и высоконагруженные системы
Язык:
русский
Кредиты:
3
Контактные часы:
14
Программа дисциплины
Аннотация
Курс посвящен расширению кругозора обучающихся в области машинного и глубинного обучения. На курсе изучаются различные приложения анализа данных, которые, как правило, не входят в программы других дисциплин цикла. Среди изучаемых на курсе тем: поиск аномалий в данных, обзор алгоритмов построения рекомендаций, EM-алгоритм, нормализационные потоки и другие приложения
Планируемые результаты обучения
- Слушатели вспомнят основные статистические подходы к поиску аномалий, а также узнают и применят на практике алгоритмы нахождения выбросов с помощью машинного обучения.
- Студенты узнают о подходах из линейной алгебры и машинного обучения для построения рекомендательных систем.
- Студенты ознакомятся с графовым подходом для решения задачи кластеризации, в частности, освоят спектральную кластеризацию. Также поговорят про метрики качества кластеризации.
- Студенты узнают, как устроен EM-алгоритм и как он применяется для мягкой кластеризации.
- Студенты узнают, в чем заключается подход автоматизированного машинного обучения и применят AutoML для решения практической задачи.
- Студенты освоят алгоритмы машинного обучения для быстрого поиска соседей и применят их для решения практических задач.
- Студенты узнают, как работают нормализационные потоки и в чем они принципиально отличаются от вариационных автокодировщиков и генеративных моделей.
Содержание учебной дисциплины
- Методы поиска аномалий
- Рекомендательные системы
- Быстрый поиск соседей
- Кластеризация
- EM-алгоритм
- Нормализационные потоки
- Автоматизированное машинное обучение (AutoML)
Список литературы
Рекомендуемая основная литература
- Введение в статистическое обучение с примерами на языке R / Г. Джеймс, Д. Уиттон, Т. Хасти, Р. Тибширани , перевод с английского С. Э. Мастицкого. — Москва : ДМК Пресс, 2017. — 456 с. — ISBN 978-5-97060-495-3. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/93580 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
Рекомендуемая дополнительная литература
- Анализ данных : учебник для вузов / В. С. Мхитарян [и др.] ; под редакцией В. С. Мхитаряна. — Москва : Издательство Юрайт, 2021. — 490 с. — (Высшее образование). — ISBN 978-5-534-00616-2. — Текст : электронный // Образовательная платформа Юрайт [сайт]. — URL: https://urait.ru/bcode/469022 (дата обращения: 28.08.2023).