Бакалавриат
2024/2025





Интеллектуальный анализ данных
Статус:
Курс обязательный (Бизнес-информатика)
Направление:
38.03.05. Бизнес-информатика
Где читается:
Высшая школа бизнеса
Когда читается:
2-й курс, 3, 4 модуль
Формат изучения:
с онлайн-курсом
Онлайн-часы:
50
Охват аудитории:
для всех кампусов НИУ ВШЭ
Преподаватели:
Саночкин Юрий Ильич
Язык:
русский
Кредиты:
5
Программа дисциплины
Аннотация
Целями освоения дисциплины «Основы машинного обучения» являются овладение студентами моделями и методами интеллектуального анализа данных и машинного обучения в задачах обработки и анализа данных, а также приобретение навыков исследователя данных (data scientist) и разработчика математических моделей, методов и алгоритмов анализа данных. Изучаются основные модели (линейные, метрические, логические), подходы к их обучению и методы обработки данных.
Цель освоения дисциплины
- Знать основные модели и методы машинного обучения и разработки данных
- Уметь адекватно применять указанные модели и методы, а также программные средства, в которых они реализованы
- Иметь навыки (приобрести опыт) анализа реальных данных с помощью изученных методов
Планируемые результаты обучения
- Владеет методами кластеризации данных
- Владеет методами построения композиций моделей
- Владеет основами математики для анализа данных
- Владеет основными подходами к оценке качества в задачах классификации и регрессии
- Знает линейные модели и умеет их обучать
- Знает модель k ближайших соседей и умеет её обучать
- Знает модель решающего дерева и умеет её обучать
- Знает основные подходы к построению рекомендательных систем
- Знает основные постановки задач и типы данных в машинном обучении
Содержание учебной дисциплины
- Введение, основные понятия анализа данных
- Математические объекты и методы в анализе данных
- Метрические методы
- Линейная регрессия и классификация
- Оценивание качества алгоритмов
- Логические методы
- Композиции алгоритмов
- Кластеризация данных
- Рекомендательные системы
Элементы контроля
- Практические домашние заданияСредняя оценка за все практические домашние задания, предусмотренные на курсе
- Письменные проверочные работыСредняя оценка за все письменные проверочные работы, предусмотренные на курсе
- Контрольная работаКонтрольная работа представляет собой проверочный элемент контроля, выполняемый студентами по результатам освоения первой части курса
- ЭкзаменЭкзамен представляет собой практическую работу, выполняемую студентами по результатам освоения курса
Промежуточная аттестация
- 2024/2025 4th module0.15 * Контрольная работа + 0.15 * Письменные проверочные работы + 0.4 * Практические домашние задания + 0.3 * Экзамен
Список литературы
Рекомендуемая основная литература
- Christopher M. Bishop. (n.d.). Australian National University Pattern Recognition and Machine Learning. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsbas&AN=edsbas.EBA0C705
- Trevor Hastie, Robert Tibshirani, & Jerome Friedman. New York. (n.d.). Book Reviews 567 The Elements of Statistical Learning: Data Mining, Inference, and Prediction. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsbas&AN=edsbas.45E1D521
Рекомендуемая дополнительная литература
- Mohri, M., Talwalkar, A., & Rostamizadeh, A. (2012). Foundations of Machine Learning. Cambridge, MA: The MIT Press. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=478737