Бакалавриат
2024/2025
Анализ данных и машинное обучение
Статус:
Курс обязательный (Бизнес-информатика)
Направление:
38.03.05. Бизнес-информатика
Когда читается:
3-й курс, 2 модуль
Формат изучения:
с онлайн-курсом
Онлайн-часы:
20
Охват аудитории:
для своего кампуса
Преподаватели:
Савченко Людмила Васильевна
Язык:
русский
Кредиты:
4
Программа дисциплины
Аннотация
Изучение дисциплины нацелено на освоение основных методов и алгоритмов машинного обучения и анализа данных с применением языка программирования Python. В результате освоения курса студенты будут способны самостоятельно проводить анализ различных наборов данных и реализовывать различные модели машинного обучения с использованием языка программирования Python. В курсе используются технологии ИИ. Курс предполагает прохождение on-line курса https://edu.hse.ru/course/view.php?id=151704
Цель освоения дисциплины
- Целями освоения данной дисциплины является формирование у студентов представления об основных принципах обучения с учителем (например, задачи регрессии и классификации) и без учителя (например, задача кластеризации). А также умение применять сервисы ИИ и алгоритмы машинного обучения на практике, например в проектировании роботов (восприятие, контроль), анализе текстов (онлайн поиск, анти-спам), компьютерном зрении, медицинских информационных системах, обработке аудио, интеллектуальном анализе баз данных и других областях.
Планируемые результаты обучения
- Интерпретировать задачу кластеризации. Применять на практике основные алгоритмы кластеризации (k-means и иерархические методы) и метод главных компонент (PCA).
- интерпретировать алгоритмы машинного обучения (с учителем, без учителя)
- уметь интерпретировать задачу линейной регрессии и метрики качества
- уметь интерпретировать задачу линейной регрессии с многими переменными. Применять полученные знания на практике.
- интерпретировать задачи классификации (бинарная, множественная) и метрики качества для задач классификации
- Интерпретировать нейронные сети, уметь применять на практике нейронные сети из библиотеки Keras
- Интерпретировать нейронные сети, уметь применять на практике нейронные сети из библиотеки Keras для разных задач (регрессии, классификации)
- Интерпретировать задачу кластеризации. Применять на практике основные алгоритмы кластеризации (k-means и DBSCAN). Применять и сравнивать показатели качества для задачи кластеризации.
- Интерпретировать задачи классификации (бинарная, множественная). Интерпретировать и применять на практике метрики качества для задач классификации (Accuracy, Precision, Recall, F1).
- Уметь интерпретировать задачу сегментации. Интерпретировать и применять на практике основные метрики качества и нейронные сети для решения задачи сегментации (U-Net, SegNet).
Содержание учебной дисциплины
- Introduction. Examples of practical tasks.
- Обзор основных алгоритмов машинного обучения, которые могут применяться в медицине. Задачи машинного обучения (регрессия, классификация, кластеризация).
- Linear regression
- Polynomial regression. The concept of overfitting and regularization.
- Classification problem. Logistic regression. The KNN algorithm. Naïve Bayes Classifier.
- Classification algorithms: decision trees and ensembles
- Unsupervised machine learning tasks. Dimension reduction
- Метрики качества задачи кластеризации
- Unsupervised machine learning tasks. The task of clustering
- Нейронные сети.
- Задача сегментации
Элементы контроля
- Лабораторные работы
- Итоговый проект в области машинного обучения
- Прохождение он-лайн курса
Промежуточная аттестация
- 2024/2025 2nd module0.3 * Итоговый проект в области машинного обучения + 0.5 * Лабораторные работы + 0.2 * Прохождение он-лайн курса
Список литературы
Рекомендуемая основная литература
- Muller, A. C., & Guido, S. (2017). Introduction to machine learning with Python: a guide for data scientists. O’Reilly Media. (HSE access: http://ebookcentral.proquest.com/lib/hselibrary-ebooks/detail.action?docID=4698164)
- Neural Networks and Deep Learning - CCBY4_068 - Michael Nielson - 2022 - Open Educational Resources: libretexts.org - https://ibooks.ru/bookshelf/390854 - 390854 - iBOOKS
Рекомендуемая дополнительная литература
- Рашка, С. Python и машинное обучение: крайне необходимое пособие по новейшей предсказательной аналитике, обязательное для более глубокого понимания методологии машинного обучения : руководство / С. Рашка , перевод с английского А. В. Логунова. — Москва : ДМК Пресс, 2017. — 418 с. — ISBN 978-5-97060-409-0. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/100905 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.