• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Магистратура 2024/2025

Анализ данных и машинное обучение

Направление: 01.04.02. Прикладная математика и информатика
Когда читается: 1-й курс, 2, 3 модуль
Формат изучения: с онлайн-курсом
Онлайн-часы: 30
Охват аудитории: для всех кампусов НИУ ВШЭ
Преподаватели: Фимина Ксения Игоревна
Прогр. обучения: Системный анализ и математические технологии
Язык: русский
Кредиты: 6

Программа дисциплины

Аннотация

Целями освоения дисциплины являются овладение студентами моделями и методами интеллектуального анализа данных, машинного и глубинного обучения в задачах обработки и анализа данных, а также приобретение навыков исследователя данных (data scientist) и разработчика математических моделей, методов и алгоритмов анализа данных. Изучаются основные модели (линейные, метрические, логические), подходы к их обучению и методы обработки данных.
Цель освоения дисциплины

Цель освоения дисциплины

  • Знакомство с основными методами машинного обучения в задачах классификации, кластеризации и регрессии.
  • Опыт построения классических статистических моделей и моделей машинного обучения с использованием математического аппарата и инструментов анализа данных
Планируемые результаты обучения

Планируемые результаты обучения

  • Освоение базовых понятий математической статистики
  • Изучение современных методов анализа данных с использованием машинного и глубинного обучения, ИИ.
  • Знакомство с Pandas, навык предобработки данных
  • Знакомство с основными понятиями и терминологиями анализа данных
  • Построение моделей классификации и регрессии на основе решающих деревьев и их комитетов
  • Знакомство с методами кластеризации, навык построения моделей кластеризации
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Описательный анализ данных. Корреляционный анализ.
  • Сравнительный анализ.
  • Дисперсионный анализ.
  • Введение в машинное обучение.
  • Решение задачи регрессии.
  • Решение задачи классификации.
  • Древовидные модели: деревья решений, случайный лес
  • Ансамбли моделей Бэггинг, бустинг, градиентный бустинг
  • Глубинное обучение.
Элементы контроля

Элементы контроля

  • неблокирующий Коллоквиум
  • неблокирующий Контрольная работа 3мод
  • неблокирующий Контрольная работ 2мод
  • неблокирующий Домашнее задание 2мод
  • неблокирующий Домашнее задание 3мод
  • неблокирующий Экзамен 3мод
Промежуточная аттестация

Промежуточная аттестация

  • 2024/2025 2nd module
    0.4 * Домашнее задание 2мод + 0.6 * Контрольная работ 2мод
  • 2024/2025 3rd module
    0,4*Коллоквиум+0,4*Контрольная работа 3мод + 0,2*Домашнее задание 3мод
Список литературы

Список литературы

Рекомендуемая основная литература

  • Python для сложных задач : наука о данных и машинное обучение, Плас, Дж. В., 2018

Рекомендуемая дополнительная литература

  • Miroslav Kubat. (2017). An Introduction to Machine Learning (Vol. 2nd ed. 2017). Springer.

Авторы

  • Крепкер Виктор Алексеевич
  • Фимина Ксения Игоревна