• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
2022/2023

Введение в анализ данных

Язык: русский
Кредиты: 5
Контактные часы: 20

Программа дисциплины

Аннотация

Изучение дисциплины «Введение в анализ данных» нацелено на освоение основных методов и алгоритмов анализа данных с применением языка программирования Python.Курс является вторым в майноре «Интеллектуальный анализ данных». Предполагается, что в результате освоения курса студенты будут способны самостоятельно проводить анализ различных наборов данных с использованием языка программирования Python.
Цель освоения дисциплины

Цель освоения дисциплины

  • Знать основные методы анализа данных; о месте и ценности методов машинного обучения и разработки данных в современной науке и практической деятельности; основные каналы научной и прикладной информации по анализу данных
  • Уметь использовать освоенные методы анализа данных для обработки конкретных наборов данных, анализировать результаты, делать выводы; формализовать конкретную задачу анализа данных и разработать алгоритм решения
  • Владеть методами программирования, отлаживания и тестирования алгоритмов анализа данных
Планируемые результаты обучения

Планируемые результаты обучения

  • Знает и умеет использовать программные реализации методов решения задачи классификации
  • Знает и умеет использовать программные реализации методов решения задачи регрессии
  • Знает и умеет использовать программные реализации основных алгоритмов кластерного анализа
  • Знает основные методы кластерного анализа данных, основные способы измерения расстояния между объектами
  • Знает основные методы решения задачи классификации, способы оценки точности классификации, способы борьбы с переобучением
  • Знает основные методы решения задачи регрессии, способы оценки ошибки предсказания
  • Знает основные типы данных, этапы предобработки данных, методы разведочного анализа данных
  • Понимает концепцию задачи классификации как задачи машинного обучения
  • Понимает концепцию задачи регрессии как задачи машинного обучения
  • Понимает концепцию кластерного анализа данных, концепцию близкости (похожести) объектов
  • Понимает концепцию структурированных и не структурированных данных, задачу анализа данных и машинного обучения
  • Умеет выполнять предобработку данных и разведочный анализ данных с помощью релевантного программного обеспечения
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Первичный анализ данных
  • Методы кластеризации
  • Методы предсказания. Регрессия
  • Методы классификации
Элементы контроля

Элементы контроля

  • неблокирующий Аудиторная работа
  • неблокирующий Контрольная работа
  • неблокирующий экзамен
Промежуточная аттестация

Промежуточная аттестация

  • 2022/2023 учебный год 1 модуль
    0.4 * Контрольная работа + 0.4 * экзамен + 0.2 * Аудиторная работа
Список литературы

Список литературы

Рекомендуемая основная литература

  • Aggarwal C. Data Mining: The Textbook. Springer International Publishing, 2015. DOI: 10.1007/978-3-319-14142-8

Рекомендуемая дополнительная литература

  • Hastie, T., Tibshirani, R., Friedman, J. The elements of statistical learning: Data Mining, Inference, and Prediction. – Springer, 2009. – 745 pp.
  • Mirkin, B. Core concepts in data analysis: summarization, correlation and visualization. – Springer Science & Business Media, 2011. – 388 pp.

Авторы

  • Гречихин Иван Сергеевич
  • Калягин Валерий Александрович
  • Казаков Максим Анатольевич
  • Лощилова Лариса Борисовна
  • Семенов Дмитрий Павлович