• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Магистратура 2023/2024

Научно-исследовательский семинар "Машинное обучение"

Лучший по критерию «Полезность курса для Вашей будущей карьеры»
Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Статус: Курс обязательный
Направление: 01.04.02. Прикладная математика и информатика
Когда читается: 1-й курс, 2, 3 модуль
Формат изучения: с онлайн-курсом
Онлайн-часы: 36
Охват аудитории: для своего кампуса
Преподаватели: Зехов Матвей Сергеевич, Рысьмятова Анастасия Александровна
Прогр. обучения: Машинное обучение и высоконагруженные системы
Язык: русский
Кредиты: 6
Контактные часы: 36

Программа дисциплины

Аннотация

Студенты узнают базовые методы, метрики и концепции машинного обучения, необходимые для решения задач регрессии и классификации. Практическая часть курса реализовывается на языке Python. Курс является необходимым для изучения более продвинутых разделов машинного обучения.
Цель освоения дисциплины

Цель освоения дисциплины

  • 1. Знать базовые концепции и определения машинного обучения: виды постановки задач, виды признаков и т.д.
  • 2. Работать с табличными данными: загружать, сохранять, модифицировать, агрегировать, работать с пропущенными значениями и т.д.
  • 3. Знать и уметь применять методы ближайших соседей.
  • 4. Знать принцип работы линейной регрессии и ее модификаций (Lasso, Ridge) и уметь их применять.
  • 5. Знать принцип действия работы градиентного спуска.
  • 6. Знать принцип работы логистической регрессии и уметь ее применять.
  • 7. Знать основные метрики задач регрессии и классификации и уметь выбирать среди них оптимальную в зависимости от постановки задачи.
  • 8. Знать метод tf-idf и уметь применять его для текстовых данных.
Планируемые результаты обучения

Планируемые результаты обучения

  • MLFlow для экспериментов, Flask для HTTP API, Синхронный и асинхронный ML сервис, Docker для контейнеризации Python-сервиса
  • Определяет: - понятие и назначение MLOPS; - как правильно построить цикл обучения и отправки модели в производственную среду; - основные показатели мониторинга моделей машинного обучения.
  • Знает и понимает цели и задачи работы над отчетностью по проекту. Знает и понимает основы критического анализа проделанной работы. Знает и понимает требования, предъявляемые к итоговому анализу существа проектной документации для целей подготовки финального отчета и работы над ошибками в рамках реализации и презентации проекта. Способен применить полученные знания, умения и навыки в отношении смоделированной или конкретной жизненной ситуации, предполагающей реализацию проекта.
  • Создание рабочих процессов с помощью AirFlow, включая определение задач, настройку расписания выполнения, определение зависимостей и передачу данных между задачами
  • Имеют представление о базовых концепциях и определении машинного обучения: виды постановки задач, виды признаков и т.д.
  • Работать с табличными данными: загружать, сохранять, модифицировать, агрегировать, работать с пропущенными значениями и т.д.
  • Уметь применять методы ближайших соседей.
  • Владеть принципами работы линейной регрессии и ее модификаций (Lasso, Ridge) и уметь их применять.
  • Знакомы с принципом действия работы градиентного спуска.
  • Знакомы с принципом работы логистической регрессии и уметь ее применять.
  • Знакомы с основными метриками задач регрессии и классификации и выбирают среди них оптимальную в зависимости от постановки задачи.
  • Знакомы с методом tf-idf и применяют его для текстовых данных.
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Линейные методы регрессии
  • Линейные методы классификации
  • Снижение размерности данных.
  • Решающие деревья и их композиции.
  • Интерпретируемость ML-моделей.
  • Кластеризация.
  • Рекомендательные системы и ранжирование.
  • Детекция аномалий и дисбаланс классов.
  • Прогнозирование временных рядов.
Элементы контроля

Элементы контроля

  • неблокирующий Домашнее задание 1
    Линейная регрессия, изучение библиотеки sklearn. Срок выполнения - 2 недели
  • неблокирующий Домашнее задание 2
    Линейная классификация. Классификация текстов. Срок выполнения - 2 недели
  • неблокирующий Домашнее задание 3
    Решающие деревья. Ансамбли над решающими деревьями. Срок выполнения - 2 недели
  • неблокирующий Домашнее задание 4
    Кластеризация. Срок выполнения - 2 недели
  • неблокирующий Контрольная работа
Промежуточная аттестация

Промежуточная аттестация

  • 2023/2024 3rd module
    Итог = Округление(0.6 * ДЗ + 0.1 * C + 0.1 * К + 0.2 * Э ), где ДЗ — средняя оценка за все домашние задания, C — оценка за курс на stepik, К — оценка за контрольную, Э — оценка за экзамен. Округление арифметическое.
Список литературы

Список литературы

Рекомендуемая основная литература

  • Платонов, А. В.  Машинное обучение : учебное пособие для вузов / А. В. Платонов. — Москва : Издательство Юрайт, 2023. — 85 с. — (Высшее образование). — ISBN 978-5-534-15561-7. — Текст : электронный // Образовательная платформа Юрайт [сайт]. — URL: https://urait.ru/bcode/520544 (дата обращения: 27.08.2024).

Рекомендуемая дополнительная литература

  • Введение в статистическое обучение с примерами на языке R / Г. Джеймс, Д. Уиттон, Т. Хасти, Р. Тибширани , перевод с английского С. Э. Мастицкого. — Москва : ДМК Пресс, 2017. — 456 с. — ISBN 978-5-97060-495-3. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/93580 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
  • Монарх, Р. Машинное обучение с участием человека / Р. Монарх , перевод с английского В. И. Бахура. — Москва : ДМК Пресс, 2022. — 498 с. — ISBN 978-5-97060-934-7. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/241211 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.

Авторы

  • Боднарук Иван Иванович