Магистратура
2022/2023
Машинное обучение 1
Статус:
Курс по выбору (Современные компьютерные науки)
Направление:
01.04.02. Прикладная математика и информатика
Кто читает:
Базовая кафедра Яндекс
Где читается:
Факультет компьютерных наук
Когда читается:
1-й курс, 3, 4 модуль
Формат изучения:
с онлайн-курсом
Онлайн-часы:
14
Охват аудитории:
для своего кампуса
Преподаватели:
Бронер Валентина Игоревна
Прогр. обучения:
Современные компьютерные науки
Язык:
русский
Кредиты:
6
Контактные часы:
64
Программа дисциплины
Аннотация
Теория обучения машин (machine learning, машинное обучение) находится на стыке прикладной статистики, численных методов оптимизации, дискретного анализа, и за последние 50 лет оформилась в самостоятельную математическую дисциплину. Методы машинного обучения составляют основу ещё более молодой дисциплины — интеллектуального анализа данных (data mining). В курсе рассматриваются основные задачи обучения по прецедентам: классификация, кластеризация, регрессия, понижение размерности. Изучаются методы их решения, как классические, так и новые, созданные за последние 10–15 лет. Упор делается на глубокое понимание математических основ, взаимосвязей, достоинств и ограничений рассматриваемых методов. Отдельные теоремы приводятся с доказательствами. Все методы излагаются по единой схеме: исходные идеи и эвристики; их формализация и математическая теория; описание алгоритма в виде слабо формализованного псевдокода; анализ достоинств, недостатков и границ применимости; пути устранения недостатков; сравнение с другими методами. примеры прикладных задач.
Цель освоения дисциплины
- Знать типологию задач машинного обучения
- Уметь работать с различными типами данных
- Владеть методами из библиотеки scikit-learn
- Знать основные модели, используемые для решения задач классификации и регрессии
- Владеть методами теоретического исследования моделей машинного обучения
- Знать концепцию переобучения, причины возникновения этого явления, методы его преодоления
Планируемые результаты обучения
- владеть методами из библиотеки scikit-learn
- владеть методами теоретического исследования моделей машинного обучения
- знать концепцию переобучения, причины возникновения этого явления, методы его преодоления
- знать основные модели, используемые для решения задач классификации и регрессии
- уметь подбирать гиперпараметры модели
- уметь работать с различными типами данных
Содержание учебной дисциплины
- Введение.
- Несбалансированные выборки. Счетчики
- Прогнозирование временных рядов
- Байесовские методы классификации
- Градиентные линейные методы
- Соревнования по анализу данных
- Решающие деревья и случайные леса
- Метрические алгоритмы
- Метрики качества, отбор признаков, работа с пропущенными значениями
- Метод опорных векторов
- Линейная регрессия и метод главных компонент
- Нелинейная регрессия и нестандартные функции потерь
- Многоклассовая классификация. Разреженные признаки. Библиотека VW
Элементы контроля
- Домашнее задание 1
- Домашнее задание 2
- ЭкзаменОценка за дисциплину выставляется в соответствии с формулой оценивания от всех пройденных элементов контроля. Экзамен не проводится.
Промежуточная аттестация
- 2022/2023 учебный год 4 модуль0.3 * Домашнее задание 2 + 0.3 * Домашнее задание 1 + 0.4 * Экзамен
Список литературы
Рекомендуемая основная литература
- Christopher M. Bishop. (n.d.). Australian National University Pattern Recognition and Machine Learning. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsbas&AN=edsbas.EBA0C705
- Inge, R., & Leif, J. (2017). Machine Learning : Advances in Research and Applications. Hauppauge, New York: Nova Science Publishers, Inc. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1652565
Рекомендуемая дополнительная литература
- Mohammed, M., Khan, M. B., & Bashier, E. B. M. (2017). Machine Learning : Algorithms and Applications. Boca Raton: CRC Press. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1293656
- Mojrian, S., Pinter, G., Joloudari, J. H., Felde, I., Nabipour, N., Nadai, L., & Mosavi, A. (2019). Hybrid Machine Learning Model of Extreme Learning Machine Radial basis function for Breast Cancer Detection and Diagnosis; a Multilayer Fuzzy Expert System. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsarx&AN=edsarx.1910.13574