Магистратура
2024/2025
Машинное обучение
Статус:
Курс обязательный (Анализ данных в девелопменте)
Направление:
01.04.02. Прикладная математика и информатика
Где читается:
Факультет компьютерных наук
Когда читается:
1-й курс, 1, 2 модуль
Формат изучения:
без онлайн-курса
Охват аудитории:
для своего кампуса
Преподаватели:
Калмыкова Надежда Сергеевна
Прогр. обучения:
Анализ данных в девелопменте
Язык:
русский
Кредиты:
6
Программа дисциплины
Аннотация
Курс посвящен изучению основных методов машинного обучения. Изучаемые темы можно разбить на три блока. Первый — работа с данными и предварительный анализ данных. Изучаются библиотеки языка Python для работы с табличными данными и для визуализации, обсуждаются методы предобработки данных, подготовки категориальных и текстовых данных. Второй блок — обучение с учителем. Изучаются линейные модели, решающие деревья, композиции моделей (случайный лес, градиентный бустинг и его имплементации), приложения в рекомендательных системах. Третий блок — обучение без учителя. Изучаются методы кластеризации, визуализации, понижения размерности. Все темы сопровождаются практикой на реальных данных. По итогам курса слушатель сможет сформулировать задачу машинного обучения, выбрать метрику качества, обучить модель, подобрать гиперпараметры, провести валидацию.
Цель освоения дисциплины
- Ознакомление студентов с теоретическими основами и основными принципами машинного обучения — а именно, с классами моделей (линейные, логические, нейросетевые), метриками качествами и подходами к подготовке данных. Формирование у студентов практических навыков работы с данными и решения прикладных задач анализа данных.
Планируемые результаты обучения
- Понимание принципов работы нейронных сетей
- Знает основные метрики качества для регрессии и классификации
- Знает принципы построения композиций моделей
- Знает теоретические основы линейных и логических методов машинного обучения
- Умеет обучать основные модели машинного обучения, оценивать их качества
- Знает основные понятия и постановки задач машинного обучения
- Умеет выполнять кластеризацию и визуализацию данных
- Знает основные метрики качества для регрессии и классификации
- Знает принципы построения композиций моделей
- Умеет выполнять полный цикл построения модели
- Умеет обучать основные модели машинного обучения, оценивать их качества
Содержание учебной дисциплины
- Введение в машинное обучение
- Обучение без учителя
- Линейные методы регрессии
- Линейные методы классификации
- Особенности работы с реальными данными
- Работа с признаками
- Решающие деревья
- Композиции алгоритмов
- Нейронные сети
- Подходы к извлечению признаков для сложных данных
- Рекомендательные системы
Элементы контроля
- Практические домашние работы
- Самостоятельные работы
- Контрольная работа
- Письменный экзамен
Промежуточная аттестация
- 2024/2025 2nd module0.15 * Контрольная работа + 0.3 * Письменный экзамен + 0.4 * Практические домашние работы + 0.15 * Самостоятельные работы
Список литературы
Рекомендуемая основная литература
- Christopher M. Bishop. (n.d.). Australian National University Pattern Recognition and Machine Learning. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsbas&AN=edsbas.EBA0C705
- Hastie, T., Tibshirani, R., & Friedman, J. H. (2009). The Elements of Statistical Learning : Data Mining, Inference, and Prediction (Vol. Second edition, corrected 7th printing). New York: Springer. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=277008
Рекомендуемая дополнительная литература
- Stephen Boyd, Lieven Vandenberghe, & Lieven V. (2015). Additional Exercises for Convex Optimization. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsbas&AN=edsbas.E7445CE1