Магистратура
2020/2021
Машинное обучение
Лучший по критерию «Полезность курса для Вашей будущей карьеры»
Статус:
Курс обязательный (Системы управления и обработки информации в инженерии)
Направление:
01.04.04. Прикладная математика
Кто читает:
Департамент прикладной математики
Когда читается:
1-й курс, 1, 2 модуль
Формат изучения:
без онлайн-курса
Преподаватели:
Горчаков Андрей Юрьевич
Прогр. обучения:
Системы управления и обработки информации в инженерии
Язык:
английский
Кредиты:
4
Контактные часы:
52
Course Syllabus
Abstract
Целями освоения дисциплины «Машинное обучение» являются развитие магистрантом навыков решения задач машинного обучения, с использованием современных вычислительной техники, программного обеспечения и языка программирования Python. Результат освоения дисциплины - умение создавать модели машинного обучения на основе информации по темам курса (компетенции ОПК-2, ПК-4, ПК-7). Охват предметной области: основные задачи машинного обучения, методы их решения, работа с широко известными библиотеками машинного обучения.
Learning Objectives
- Развитие магистрантом навыков решения задач машинного обучения, с использованием современных вычислительной техники, программного обеспечения и языка программирования Python.
Expected Learning Outcomes
- Чтение данных, предобработка данных. Использование библиотек Pandas, NumPy.
- Создание простых моделей машинного обучения. Использование библиотеки scikit-learn
- Создание ансамблей. Использование библиотек xgboost, Microsoft LightGBM, CatBoost
- Приемы устранения переобучения моделей, гипероптимизация параметров.
Course Contents
- Постановка задач машинного обучения. Задачи классификации, регрессии, кластеризации. Подготовка данных. Библиотеки Pandas, NumPy. Метрики качества прогнозов.Задачи машинного обучения. Обучающая выборка. Обучение с учителем, обучение без учителя. Задачи классификации, регрессии, кластеризации. Использование языка программирования Python, методы установки необходимых библиотек. Библиотеки Pandas, NumPy. Подготовка обучающей выборки. DataFrame (Series), атрибуты и методы DataFrame, извлечение срезов. DataFrameGroupBy, атрибуты и методы DataFrameGroupBy. Библиотека scikit-learn. Метрики классификации, регрессии и кластерные метрики.
- Методы часть 1. Линейная модель, метод опорных векторов, метод ближайших соседей, деревья регрессии и классификации. Модели нейронных сетей. Библиотека scikit-learn.Метод наименьших квадратов. Библиотека scikit-learn. Линейная регрессия. Логистическая регрессия. Регуляризация l1 и l2. Гребневая регрессия. Метод опорных векторов. Метод ближайших соседей. Деревья регрессии и классификации. Модели нейронных сетей. Многослойный перцептрон.
- Методы часть 2. Бустинг, Баггинг. Библиотеки xgboost, Microsoft LightGBM, CatBoost (Яндекс)Понятие бустинг и баггинг. Градиентный бустинг. Библиотеки xgboost, Microsoft LightGBM, CatBoost (Яндекс).
- Методы часть 3. Валидация, кросс валидация. Стекинг. Гипероптимизация параметров. Онлайн обучение.Валидация, кросс-валидация. Стекинг. Гипероптимизация параметров. Онлайн обучение.
Assessment Elements
- Аудиторная работа
- Самостоятельная работа
- Итоговый экзамен
- Контрольно-измерительные материалы
- Аудиторная работа
- Самостоятельная работа
- Итоговый экзамен
- Контрольно-измерительные материалы
Interim Assessment
- Interim assessment (2 module)0.3 * Аудиторная работа + 0.4 * Итоговый экзамен + 0.3 * Самостоятельная работа
Bibliography
Recommended Core Bibliography
- McKinney, W. (2018). Python for Data Analysis : Data Wrangling with Pandas, NumPy, and IPython (Vol. Second edition). Sebastopol, CA: O’Reilly Media. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1605925
- Изучаем Python, Лутц, М., 2014
- Теория вероятностей и математическая статистика : учебник для вузов, Колемаев, В. А., 1999
Recommended Additional Bibliography
- Romano, F. (2015). Learning Python. Birmingham: Packt Publishing. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=nlebk&AN=1133614