We use cookies in order to improve the quality and usability of the HSE website. More information about the use of cookies is available here, and the regulations on processing personal data can be found here. By continuing to use the site, you hereby confirm that you have been informed of the use of cookies by the HSE website and agree with our rules for processing personal data. You may disable cookies in your browser settings.

  • A
  • A
  • A
  • ABC
  • ABC
  • ABC
  • А
  • А
  • А
  • А
  • А
Regular version of the site

Data Analysis and Machine Learning

2024/2025
Academic Year
RUS
Instruction in Russian
6
ECTS credits
Course type:
Compulsory course
When:
1 year, 2, 3 module

Instructors


Сиротинский Никита Вадимович


Якубов Вячеслав Юсупович

Программа дисциплины

Аннотация

Целями освоения дисциплины являются овладение студентами моделями и методами интеллектуального анализа данных, машинного и глубинного обучения в задачах обработки и анализа данных, а также приобретение навыков исследователя данных (data scientist) и разработчика математических моделей, методов и алгоритмов анализа данных. Изучаются основные модели (линейные, метрические, логические), подходы к их обучению и методы обработки данных.
Цель освоения дисциплины

Цель освоения дисциплины

  • Знакомство с основными методами машинного обучения в задачах классификации, кластеризации и регрессии.
  • Опыт построения классических статистических моделей и моделей машинного обучения с использованием математического аппарата и инструментов анализа данных
Планируемые результаты обучения

Планируемые результаты обучения

  • Освоение базовых понятий математической статистики
  • Изучение современных методов анализа данных с использованием машинного и глубинного обучения, ИИ.
  • Знакомство с Pandas, навык предобработки данных
  • Знакомство с основными понятиями и терминологиями анализа данных
  • Построение моделей классификации и регрессии на основе решающих деревьев и их комитетов
  • Знакомство с методами кластеризации, навык построения моделей кластеризации
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Описательный анализ данных. Корреляционный анализ.
  • Сравнительный анализ.
  • Дисперсионный анализ.
  • Введение в машинное обучение.
  • Решение задачи регрессии.
  • Решение задачи классификации.
  • Древовидные модели: деревья решений, случайный лес
  • Ансамбли моделей Бэггинг, бустинг, градиентный бустинг
  • Глубинное обучение.
Элементы контроля

Элементы контроля

  • неблокирующий Коллоквиум
  • неблокирующий Контрольная работа 3мод
  • неблокирующий Контрольная работ 2мод
  • неблокирующий Домашнее задание 2мод
  • неблокирующий Домашнее задание 3мод
  • неблокирующий Экзамен 3мод
Промежуточная аттестация

Промежуточная аттестация

  • 2024/2025 2nd module
    0.4 * Домашнее задание 2мод + 0.6 * Контрольная работ 2мод
  • 2024/2025 3rd module
    0,4*Коллоквиум+0,4*Контрольная работа 3мод + 0,2*Домашнее задание 3мод
Список литературы

Список литературы

Рекомендуемая основная литература

  • Python для сложных задач : наука о данных и машинное обучение, Плас, Дж. В., 2018

Рекомендуемая дополнительная литература

  • Miroslav Kubat. (2017). An Introduction to Machine Learning (Vol. 2nd ed. 2017). Springer.

Авторы

  • Крепкер Виктор Алексеевич
  • Фимина Ксения Игоревна