Бакалавриат
2021/2022
Машинное обучение 1
Лучший по критерию «Новизна полученных знаний»
Статус:
Курс обязательный (Прикладная математика и информатика)
Направление:
01.03.02. Прикладная математика и информатика
Где читается:
Факультет компьютерных наук
Когда читается:
3-й курс, 1, 2 модуль
Формат изучения:
с онлайн-курсом
Онлайн-часы:
20
Охват аудитории:
для всех кампусов НИУ ВШЭ
Преподаватели:
Биршерт Алексей Дмитриевич,
Глазкова Екатерина Васильевна,
Зехов Матвей Сергеевич,
Каюмов Эмиль Марселевич,
Садртдинов Ильдус Рустемович,
Семенкин Антон Александрович,
Собянин Кирилл Валентинович,
Соколов Евгений Андреевич,
Ульянкин Филипп Валерьевич,
Хрушков Павел Вадимович,
Цвигун Аким Олегович,
Шабалин Александр Михайлович
Язык:
русский
Кредиты:
5
Контактные часы:
60
Программа дисциплины
Аннотация
Курс посвящён изучению основных методов машинного обучения. Изучаемые темы можно разбить на три блока. Первый — работа с данными и предварительный анализ данных. Изучаются библиотеки языка Python для работы с табличными данными и для визуализации, обсуждаются методы предобработки данных, подготовки категориальных и текстовых данных. Второй блок — обучение с учителем. Изучаются линейные модели, решающие деревья, композиции моделей (случайный лес, градиентный бустинг и его имплементации), приложения в рекомендательных системах. Третий блок — обучение без учителя. Изучаются методы кластеризации, визуализации, понижения размерности. Все темы сопровождаются практикой на реальных данных. По итогам курса слушатель сможет сформулировать задачу машинного обучения, выбрать метрику качества, обучить модель, подобрать гиперпараметры, провести валидацию.
Цель освоения дисциплины
- Знает основные понятия и постановки задач машинного обучения
- Знает теоретические основы линейных и логических методов машинного обучения
- Знает принципы построения композиций моделей
- Знает основные метрики качества для регрессии и классификации
- Умеет выполнять полный цикл построения модели
- Умеет обучать основные модели машинного обучения, оценивать их качества
- Умеет выполнять кластеризацию и визуализацию данных
Планируемые результаты обучения
- Знает основные метрики качества для регрессии и классификации
- Знает основные понятия и постановки задач машинного обучения
- Знает принципы построения композиций моделей
- Знает теоретические основы линейных и логических методов машинного обучения
- Умеет выполнять кластеризацию и визуализацию данных
- Умеет выполнять полный цикл построения модели
- Умеет обучать основные модели машинного обучения, оценивать их качества
Содержание учебной дисциплины
- Введение в машинное обучение и анализ данных
- Линейные модели
- Решающие деревья
- Композиции моделей
- Обучение без учителя
- Подготовка данных
- Рекомендательные системы
Элементы контроля
- Проверочная работа (ПР)Проверочные работы на семинарах, направленные на контроль усвоения теоретических знаний
- Домашнее задание (ДЗ)Средняя оценка за все выданные домашние задания
- Контрольная работа (КР)Письменная контрольная работа
- ЭкзаменЭкзамен проводится в письменном формате.
Промежуточная аттестация
- 2021/2022 учебный год 2 модуль0.15 * Проверочная работа (ПР) + 0.3 * Экзамен + 0.4 * Домашнее задание (ДЗ) + 0.15 * Контрольная работа (КР)
Список литературы
Рекомендуемая основная литература
- Christopher M. Bishop. (n.d.). Australian National University Pattern Recognition and Machine Learning. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsbas&AN=edsbas.EBA0C705
- Hastie, T., Tibshirani, R., & Friedman, J. H. (2009). The Elements of Statistical Learning : Data Mining, Inference, and Prediction (Vol. Second edition, corrected 7th printing). New York: Springer. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=277008
Рекомендуемая дополнительная литература
- Stephen Boyd, Lieven Vandenberghe, & Lieven V. (2015). Additional Exercises for Convex Optimization. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsbas&AN=edsbas.E7445CE1