2023/2024
Введение в машинное обучение
Статус:
Маго-лего
Кто читает:
Факультет физики
Когда читается:
1 модуль
Онлайн-часы:
20
Охват аудитории:
для своего кампуса
Преподаватели:
Джанибекова Сапият Хисаевна
Язык:
русский
Кредиты:
3
Контактные часы:
6
Программа дисциплины
Аннотация
Курс посвящён изучению основных методов машинного обучения. Изучаемые темы можно разбить на три блока. Первый — работа с данными и предварительный анализ данных. Изучаются библиотеки языка Python для работы с табличными данными и для визуализации, обсуждаются методы предобработки данных, подготовки категориальных и текстовых данных. Второй блок — обучение с учителем. Изучаются линейные модели, решающие деревья, композиции моделей (случайный лес, градиентный бустинг и его имплементации), приложения в рекомендательных системах. Третий блок — обучение без учителя. Изучаются методы кластеризации, визуализации, понижения размерности. Все темы сопровождаются практикой на реальных данных. По итогам курса слушатель сможет сформулировать задачу машинного обучения, выбрать метрику качества, обучить модель, подобрать гиперпараметры, провести валидацию.
Цель освоения дисциплины
- Знает основные понятия и постановки задач машинного обучения
- Знает теоретические основы линейных и логических методов машинного обучения
- Знает принципы построения композиций моделей
- Знает основные метрики качества для регрессии и классификации
- Умеет выполнять полный цикл построения модели
- Умеет обучать основные модели машинного обучения, оценивать их качества
- Умеет выполнять кластеризацию и визуализацию данных
Содержание учебной дисциплины
- Введение. Примеры задач. Логические методы: решающие деревья и решающие леса.
- Метрические методы классификации. Линейные методы, стохастический градиент.
- Метод опорных векторов (SVM). Логистическая регрессия. Метрики качества классификации.
- Линейная регрессия. Понижение размерности, метод главных компонент.
- Композиции алгоритмов, градиентный бустинг. Нейронные сети.
- Кластеризация и визуализация. Частичное обучение.
- Прикладные задачи анализа данных: постановки и методы решения.
Список литературы
Рекомендуемая основная литература
- 9781491912140 - Vanderplas, Jacob T. - Python Data Science Handbook : Essential Tools for Working with Data - 2016 - O'Reilly Media - https://search.ebscohost.com/login.aspx?direct=true&db=nlebk&AN=1425081 - nlebk - 1425081
- Изучаем Python, Лутц, М., 2014
- Шелудько, В. М. Основы программирования на языке высокого уровня Python : учебное пособие / В. М. Шелудько ; Южный федеральный университет. - Ростов-на-Дону ; Таганрог : Издательство Южного федерального университета, 2017. - 146 с. - ISBN 978-5-9275-2649-9. - Текст : электронный. - URL: https://new.znanium.com/catalog/product/1021662 - Текст : электронный. - URL: http://znanium.com/catalog/product/1021662
Рекомендуемая дополнительная литература
- 9781785284571 - Romano, Fabrizio - Learning Python - 2015 - Packt Publishing - http://search.ebscohost.com/login.aspx?direct=true&db=nlebk&AN=1133614 - nlebk - 1133614
- Bill Lubanovic. (2019). Introducing Python : Modern Computing in Simple Packages. [N.p.]: O’Reilly Media. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=2291494