Бакалавриат
2023/2024
Анализ данных
Статус:
Курс обязательный
Направление:
09.03.04. Программная инженерия
Когда читается:
3-й курс, 4 модуль
Формат изучения:
без онлайн-курса
Охват аудитории:
для своего кампуса
Преподаватели:
Багаутдинова Эльмира Рафиковна
Язык:
русский
Кредиты:
3
Контактные часы:
44
Программа дисциплины
Аннотация
Изучение дисциплины «Введение в анализ данных» нацелено на освоение основных методов и алгоритмов анализа данных с применением языка программирования Python.Курс является вторым в майноре «Интеллектуальный анализ данных». Предполагается, что в результате освоения курса студенты будут способны самостоятельно проводить анализ различных наборов данных с использованием языка программирования Python.
Цель освоения дисциплины
- Знать основные методы анализа данных; о месте и ценности методов машинного обучения и разработки данных в современной науке и практической деятельности; основные каналы научной и прикладной информации по анализу данных
- Уметь использовать освоенные методы анализа данных для обработки конкретных наборов данных, анализировать результаты, делать выводы; формализовать конкретную задачу анализа данных и разработать алгоритм решения
- Владеть методами программирования, отлаживания и тестирования алгоритмов анализа данных
Планируемые результаты обучения
- Знает и умеет использовать программные реализации методов решения задачи классификации
- Знает и умеет использовать программные реализации методов решения задачи регрессии
- Знает и умеет использовать программные реализации основных алгоритмов кластерного анализа
- Знает основные методы кластерного анализа данных, основные способы измерения расстояния между объектами
- Знает основные методы решения задачи классификации, способы оценки точности классификации, способы борьбы с переобучением
- Знает основные методы решения задачи регрессии, способы оценки ошибки предсказания
- Знает основные типы данных, этапы предобработки данных, методы разведочного анализа данных
- Понимает концепцию задачи классификации как задачи машинного обучения
- Понимает концепцию задачи регрессии как задачи машинного обучения
- Понимает концепцию кластерного анализа данных, концепцию близкости (похожести) объектов
- Понимает концепцию структурированных и не структурированных данных, задачу анализа данных и машинного обучения
- Умеет выполнять предобработку данных и разведочный анализ данных с помощью релевантного программного обеспечения
Содержание учебной дисциплины
- Первичный анализ данных
- Методы кластеризации
- Методы предсказания. Регрессия
- Методы классификации
Промежуточная аттестация
- 2023/2024 4th module0.2 * Домашнее задание + 0.2 * Практическая работа + 0.6 * Экзамен
Список литературы
Рекомендуемая основная литература
- Aggarwal C. Data Mining: The Textbook. Springer International Publishing, 2015. DOI: 10.1007/978-3-319-14142-8
Рекомендуемая дополнительная литература
- Hastie, T., Tibshirani, R., Friedman, J. The elements of statistical learning: Data Mining, Inference, and Prediction. – Springer, 2009. – 745 pp.
- Mirkin, B. Core concepts in data analysis: summarization, correlation and visualization. – Springer Science & Business Media, 2011. – 388 pp.