Магистратура
2023/2024
Научно-исследовательский семинар "Машинное обучение"
Лучший по критерию «Полезность курса для Вашей будущей карьеры»
Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Статус:
Курс обязательный
Направление:
01.04.02. Прикладная математика и информатика
Где читается:
Факультет компьютерных наук
Когда читается:
1-й курс, 2, 3 модуль
Формат изучения:
с онлайн-курсом
Онлайн-часы:
36
Охват аудитории:
для своего кампуса
Прогр. обучения:
Машинное обучение и высоконагруженные системы
Язык:
русский
Кредиты:
6
Контактные часы:
36
Программа дисциплины
Аннотация
Студенты узнают базовые методы, метрики и концепции машинного обучения, необходимые для решения задач регрессии и классификации. Практическая часть курса реализовывается на языке Python. Курс является необходимым для изучения более продвинутых разделов машинного обучения.
Цель освоения дисциплины
- 1. Знать базовые концепции и определения машинного обучения: виды постановки задач, виды признаков и т.д.
- 2. Работать с табличными данными: загружать, сохранять, модифицировать, агрегировать, работать с пропущенными значениями и т.д.
- 3. Знать и уметь применять методы ближайших соседей.
- 4. Знать принцип работы линейной регрессии и ее модификаций (Lasso, Ridge) и уметь их применять.
- 5. Знать принцип действия работы градиентного спуска.
- 6. Знать принцип работы логистической регрессии и уметь ее применять.
- 7. Знать основные метрики задач регрессии и классификации и уметь выбирать среди них оптимальную в зависимости от постановки задачи.
- 8. Знать метод tf-idf и уметь применять его для текстовых данных.
Планируемые результаты обучения
- MLFlow для экспериментов, Flask для HTTP API, Синхронный и асинхронный ML сервис, Docker для контейнеризации Python-сервиса
- Определяет: - понятие и назначение MLOPS; - как правильно построить цикл обучения и отправки модели в производственную среду; - основные показатели мониторинга моделей машинного обучения.
- Знает и понимает цели и задачи работы над отчетностью по проекту. Знает и понимает основы критического анализа проделанной работы. Знает и понимает требования, предъявляемые к итоговому анализу существа проектной документации для целей подготовки финального отчета и работы над ошибками в рамках реализации и презентации проекта. Способен применить полученные знания, умения и навыки в отношении смоделированной или конкретной жизненной ситуации, предполагающей реализацию проекта.
- Создание рабочих процессов с помощью AirFlow, включая определение задач, настройку расписания выполнения, определение зависимостей и передачу данных между задачами
- Имеют представление о базовых концепциях и определении машинного обучения: виды постановки задач, виды признаков и т.д.
- Работать с табличными данными: загружать, сохранять, модифицировать, агрегировать, работать с пропущенными значениями и т.д.
- Уметь применять методы ближайших соседей.
- Владеть принципами работы линейной регрессии и ее модификаций (Lasso, Ridge) и уметь их применять.
- Знакомы с принципом действия работы градиентного спуска.
- Знакомы с принципом работы логистической регрессии и уметь ее применять.
- Знакомы с основными метриками задач регрессии и классификации и выбирают среди них оптимальную в зависимости от постановки задачи.
- Знакомы с методом tf-idf и применяют его для текстовых данных.
Содержание учебной дисциплины
- Линейные методы регрессии
- Линейные методы классификации
- Снижение размерности данных.
- Решающие деревья и их композиции.
- Интерпретируемость ML-моделей.
- Кластеризация.
- Рекомендательные системы и ранжирование.
- Детекция аномалий и дисбаланс классов.
- Прогнозирование временных рядов.
Элементы контроля
- Домашнее задание 1Линейная регрессия, изучение библиотеки sklearn. Срок выполнения - 2 недели
- Домашнее задание 2Линейная классификация. Классификация текстов. Срок выполнения - 2 недели
- Домашнее задание 3Решающие деревья. Ансамбли над решающими деревьями. Срок выполнения - 2 недели
- Домашнее задание 4Кластеризация. Срок выполнения - 2 недели
- Контрольная работа
Промежуточная аттестация
- 2023/2024 3rd moduleИтог = Округление(0.6 * ДЗ + 0.1 * C + 0.1 * К + 0.2 * Э ), где ДЗ — средняя оценка за все домашние задания, C — оценка за курс на stepik, К — оценка за контрольную, Э — оценка за экзамен. Округление арифметическое.
Список литературы
Рекомендуемая основная литература
- Платонов, А. В. Машинное обучение : учебное пособие для вузов / А. В. Платонов. — Москва : Издательство Юрайт, 2023. — 85 с. — (Высшее образование). — ISBN 978-5-534-15561-7. — Текст : электронный // Образовательная платформа Юрайт [сайт]. — URL: https://urait.ru/bcode/520544 (дата обращения: 27.08.2024).
Рекомендуемая дополнительная литература
- Введение в статистическое обучение с примерами на языке R / Г. Джеймс, Д. Уиттон, Т. Хасти, Р. Тибширани , перевод с английского С. Э. Мастицкого. — Москва : ДМК Пресс, 2017. — 456 с. — ISBN 978-5-97060-495-3. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/93580 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
- Монарх, Р. Машинное обучение с участием человека / Р. Монарх , перевод с английского В. И. Бахура. — Москва : ДМК Пресс, 2022. — 498 с. — ISBN 978-5-97060-934-7. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/241211 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.