• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Магистратура 2022/2023

Научно-исследовательский семинар "Прикладные задачи анализа данных"

Лучший по критерию «Полезность курса для Вашей будущей карьеры»
Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Лучший по критерию «Новизна полученных знаний»
Направление: 01.04.02. Прикладная математика и информатика
Когда читается: 2-й курс, 1 модуль
Формат изучения: без онлайн-курса
Охват аудитории: для своего кампуса
Прогр. обучения: Машинное обучение и высоконагруженные системы
Язык: русский
Кредиты: 3
Контактные часы: 14

Программа дисциплины

Аннотация

Курс посвящен расширению кругозора обучающихся в области машинного и глубинного обучения. На курсе изучаются различные приложения анализа данных, которые, как правило, не входят в программы других дисциплин цикла. Среди изучаемых на курсе тем: поиск аномалий в данных, обзор алгоритмов построения рекомендаций, EM-алгоритм, нормализационные потоки и другие приложения
Цель освоения дисциплины

Цель освоения дисциплины

  • Расширение кругозора и компетенций слушателей в области анализа данных.
Планируемые результаты обучения

Планируемые результаты обучения

  • Слушатели вспомнят основные статистические подходы к поиску аномалий, а также узнают и применят на практике алгоритмы нахождения выбросов с помощью машинного обучения.
  • Студенты узнают о подходах из линейной алгебры и машинного обучения для построения рекомендательных систем.
  • Студенты ознакомятся с графовым подходом для решения задачи кластеризации, в частности, освоят спектральную кластеризацию. Также поговорят про метрики качества кластеризации.
  • Студенты узнают, как устроен EM-алгоритм и как он применяется для мягкой кластеризации.
  • Студенты узнают, в чем заключается подход автоматизированного машинного обучения и применят AutoML для решения практической задачи.
  • Студенты освоят алгоритмы машинного обучения для быстрого поиска соседей и применят их для решения практических задач.
  • Студенты узнают, как работают нормализационные потоки и в чем они принципиально отличаются от вариационных автокодировщиков и генеративных моделей.
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Методы поиска аномалий
  • Рекомендательные системы
  • Быстрый поиск соседей
  • Кластеризация
  • EM-алгоритм
  • Нормализационные потоки
  • Автоматизированное машинное обучение (AutoML)
Элементы контроля

Элементы контроля

  • неблокирующий Тесты
  • неблокирующий ДЗ
Промежуточная аттестация

Промежуточная аттестация

  • 2022/2023 учебный год 1 модуль
    0.3 * Тесты + 0.7 * ДЗ
Список литературы

Список литературы

Рекомендуемая основная литература

  • Введение в статистическое обучение с примерами на языке R / Г. Джеймс, Д. Уиттон, Т. Хасти, Р. Тибширани , перевод с английского С. Э. Мастицкого. — Москва : ДМК Пресс, 2017. — 456 с. — ISBN 978-5-97060-495-3. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/93580 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.

Рекомендуемая дополнительная литература

  • Анализ данных : учебник для вузов / В. С. Мхитарян [и др.] ; под редакцией В. С. Мхитаряна. — Москва : Издательство Юрайт, 2021. — 490 с. — (Высшее образование). — ISBN 978-5-534-00616-2. — Текст : электронный // Образовательная платформа Юрайт [сайт]. — URL: https://urait.ru/bcode/469022 (дата обращения: 28.08.2023).

Авторы

  • Литвишкина Ален Витальевна
  • Кантонистова Елена Олеговна