2022/2023
Введение в анализ данных
Статус:
Майнор (Экономика и анализ бизнеса (заочное обучение))
Где читается:
Факультет экономики НИУ ВШЭ (Нижний Новгород)
Когда читается:
1 модуль
Охват аудитории:
для своего кампуса
Преподаватели:
Лощилова Лариса Борисовна
Язык:
русский
Кредиты:
5
Контактные часы:
20
Программа дисциплины
Аннотация
Изучение дисциплины «Введение в анализ данных» нацелено на освоение основных методов и алгоритмов анализа данных с применением языка программирования Python.Курс является вторым в майноре «Интеллектуальный анализ данных». Предполагается, что в результате освоения курса студенты будут способны самостоятельно проводить анализ различных наборов данных с использованием языка программирования Python.
Цель освоения дисциплины
- Знать основные методы анализа данных; о месте и ценности методов машинного обучения и разработки данных в современной науке и практической деятельности; основные каналы научной и прикладной информации по анализу данных
- Уметь использовать освоенные методы анализа данных для обработки конкретных наборов данных, анализировать результаты, делать выводы; формализовать конкретную задачу анализа данных и разработать алгоритм решения
- Владеть методами программирования, отлаживания и тестирования алгоритмов анализа данных
Планируемые результаты обучения
- Знает и умеет использовать программные реализации методов решения задачи классификации
- Знает и умеет использовать программные реализации методов решения задачи регрессии
- Знает и умеет использовать программные реализации основных алгоритмов кластерного анализа
- Знает основные методы кластерного анализа данных, основные способы измерения расстояния между объектами
- Знает основные методы решения задачи классификации, способы оценки точности классификации, способы борьбы с переобучением
- Знает основные методы решения задачи регрессии, способы оценки ошибки предсказания
- Знает основные типы данных, этапы предобработки данных, методы разведочного анализа данных
- Понимает концепцию задачи классификации как задачи машинного обучения
- Понимает концепцию задачи регрессии как задачи машинного обучения
- Понимает концепцию кластерного анализа данных, концепцию близкости (похожести) объектов
- Понимает концепцию структурированных и не структурированных данных, задачу анализа данных и машинного обучения
- Умеет выполнять предобработку данных и разведочный анализ данных с помощью релевантного программного обеспечения
Содержание учебной дисциплины
- Первичный анализ данных
- Методы кластеризации
- Методы предсказания. Регрессия
- Методы классификации
Промежуточная аттестация
- 2022/2023 учебный год 1 модуль0.4 * Контрольная работа + 0.4 * экзамен + 0.2 * Аудиторная работа
Список литературы
Рекомендуемая основная литература
- Aggarwal C. Data Mining: The Textbook. Springer International Publishing, 2015. DOI: 10.1007/978-3-319-14142-8
Рекомендуемая дополнительная литература
- Hastie, T., Tibshirani, R., Friedman, J. The elements of statistical learning: Data Mining, Inference, and Prediction. – Springer, 2009. – 745 pp.
- Mirkin, B. Core concepts in data analysis: summarization, correlation and visualization. – Springer Science & Business Media, 2011. – 388 pp.