2023/2024
Введение в машинное обучение на Python
Статус:
Маго-лего
Кто читает:
Департамент социологии
Когда читается:
1 модуль
Онлайн-часы:
48
Охват аудитории:
для всех кампусов НИУ ВШЭ
Преподаватели:
Ярошенко Евгения Игоревна
Язык:
русский
Кредиты:
3
Контактные часы:
6
Программа дисциплины
Аннотация
Данный курс включает рассмотрение широкого круга тем, связанных с машиннымобучением. В рамках курса у студентов будет сформирован большой набор навыков,который позволит им в дальнейшем ставить и выполнять ключевые задачи машинногообучения.Курс начинается с самых основ машинного обучения. Последующие темыкурса посвящены задачам классификации и предсказания, восстановлению пропущенныхзначений и выявлению аномалий в данных. Среди классов алгоритмов, которыерассматриваются в курсе — регрессионный и кластерный анализ, различныеклассификаторы (например, решающие деревья), вероятностные алгоритмы, ансамбли,а также алгоритмы кросс-валидации и отбора признаков.Курс предназначен для студентов магистратуры и предусматривает самостоятельныезанятия студентов на популярной образовательной онлайн-платформе, а такжесеминарские занятия с преподавателем.
Цель освоения дисциплины
- Сформировать системное представление о машинном обучении
- Научить студентов понимать и ставить задачи в рамках машинного обучения
- Осветить ключевые проблемы, возникающие при использовании машинного обучения, и существующие методы их решения
- Сформировать навыки практического применения машинного обучения к решению широкого спектра задач
Планируемые результаты обучения
- Называет и определяет основные понятия машинного обучения
- Восстанавливает пропущенные или некорректные значения с помощью моделей машинного обучения
- Выявляет наблюдения с аномальными значениями признаков
- Кластеризует наблюдения в заданной предметной области
- Использует регрессионный анализ данных для предсказания поведения объектов
- Классифицирует наблюдения в заданной предметной области
- Объясняет преимущества одних алгоритмов классификации перед другими
- Называет методы выбора оптимальных параметров алгоритмов
- Объясняет необходимость применения и использует кросс-валидацию в машинном обучении
- Объясняет принцип обучения решающих деревьев
- Использует решающие деревья для предсказания и классификации данных
- Использует вероятностные алгоритмы в задачах машинного обучения
- Использует ансамбли алгоритмов машинного обучения для более точного предсказания или классификации данных
- Отбирает релевантные признаки с помощью алгоритмов машинного обучения
Содержание учебной дисциплины
- Введение в машинное обучение и основы статистики
- Восстановление пропущенных значений
- Поиск выбросов и аномальных значений
- Кластерный анализ
- Регрессионный анализ
- Классификация и линейные классификаторы
- Кросс-валидация
- Решающие деревья
- Вероятностные алгоритмы
- Ансамбли алгоритмов
- Отбор признаков
Промежуточная аттестация
- 2023/2024 учебный год 1 модуль0.2 * Контрольная работа 1 + 0.3 * Контрольная работа 2 + 0.5 * Прохождение онлайн-курса
Список литературы
Рекомендуемая основная литература
- Aurélien Géron. (2019). Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow : Concepts, Tools, and Techniques to Build Intelligent Systems: Vol. Second edition. O’Reilly Media.
- Knox, S. W. (2018). Machine Learning : A Concise Introduction. Hoboken, New Jersey: Wiley. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1729639
- Machine learning fundamentals : a concise introduction, Jiang, H., 2021
- Machine learning in action, Harrington, P., 2012
- Müller, A. C., & Guido, S. (2017). Introduction to Machine Learning with Python : A Guide for Data Scientists: Vol. First edition. Reilly - O’Reilly Media.
- The hundred-page machine learning book, Burkov, A., 2019
- Введение в машинное обучение с помощью Python : руководство для специалистов по работе с данными, Мюллер, А., 2018
- Прикладное машинное обучение с помощью Scikit-Learn и TensorFlow : концепции, инструменты и техники для создания интеллектуальных систем: пер. с англ., Жерон, О., 2018
Рекомендуемая дополнительная литература
- Machine learning : beginner's guide to machine learning, data mining, big data, artificial intelligence and neural networks, Trinity, L., 2019
- Python для сложных задач: наука о данных и машинное обучение : пер. с англ., Плас, Дж. Вандер, 2019