2020/2021
Классификация статистических данных
Статус:
Майнор
Кто читает:
Департамент статистики и анализа данных
Где читается:
Факультет экономических наук
Когда читается:
3, 4 модуль
Преподаватели:
Антонян Анна Артуровна,
Балычева Юлия Евгеньевна,
Богомолова Полина Максимовна,
Васильев Денис Филиппович,
Звездина Наталья Валерьевна,
Максимова Маргарита Максимовна
Язык:
русский
Кредиты:
5
Контактные часы:
76
Программа дисциплины
Аннотация
Целью курса является изучение основных направлений развития современных методов кластеризации объектов, среди которых иерархические и итерационные алгоритмы кластерного анализа, параметрическая и непараметрическая классификация, деревья решений и случайные леса. Важной особенностью курса является широкое использование наглядных примеров и применение широкого арсенала современных средств обработки статистической информации (например, в ППП SPSS, средах R, Python), освобождающих исследователя от вычислительной рутины и позволяющих превратить статистическое исследование в увлекательное занятие.
Цель освоения дисциплины
- Целью освоения дисциплины Сравнительный анализ и классификация данных» является получение студентами основ понимания фундаментальных статистических принципов, роли многомерного статистического инструментария в фундаментальных и прикладных исследованиях. Особенностью курса является наличие большого числа примеров из реальной практи-ки, наглядно демонстрирующих разнообразие областей применения многомерного статисти-ческого инструментария, его значимости для различных сфер деятельности. При этом обуче-ние студентов основным графическим и табличным представлениям данных, основам их статистической обработки позволяет сделать результаты расчетов более наглядными и доступными для понимания и интерпретации. Знакомство с возможностями сбора и обработки данных будет опираться как на уни-версальные информационные технологии, так и на специализированные пакеты прикладных программ (ППП SPSS), а также сопровождаться большим количеством практических приме-ров и иллюстраций. За счет широкого применения компьютерных технологий в курсе значительное внима-ние уделяется интерпретации данных и статистических характеристик, получаемых по ре-зультатам расчетов.
Планируемые результаты обучения
- Собирает информацию из разных источников, Проводит предварительный анализ данных, Изучает связи между переменными в многомерном пространстве с использованием современных программных продуктов
- Проводит класстеризацию многомерных наблюдений с использованием иерархических и итеративных алгоритмов кластерного анализа. Строит и интерпретирует дендрограммы.
- Использует итерационные алгоритмы для решения задач кластеризации объектов
- Использует дскриминантный анализ для кластеризации новых объектов. Строит дискриминантные функции, интерпретирует межгрупповые различия. Выбирает показатели, обладающие наибольшей дискриминирующей силой
- Проводит кластеризацию объектов с использованием деревьев решений.
Содержание учебной дисциплины
- Предмет, содержание, задачи курса. Предварительный анализ данных. Основы корреляционного анализа
- Кластеризация многомерных наблюдений. Кластерный анализ
- Кластеризация многомерных наблюдений с обучением. Основы дискриминантного анализа
- Деревья решений, случайные леса, нейросети
Элементы контроля
- Модульная работа 1
- Модульная работа 2
- Активность на семинарах
- Самостоятельная работа на лекциях
- Экзамен
Промежуточная аттестация
- Промежуточная аттестация (4 модуль)0.2 * Активность на семинарах + 0.2 * Модульная работа 1 + 0.2 * Модульная работа 2 + 0.1 * Самостоятельная работа на лекциях + 0.3 * Экзамен
Список литературы
Рекомендуемая основная литература
- Meyers, L. S. (2013). Performing Data Analysis Using IBM SPSS. Hoboken: Wiley. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=610849
- Груздев А.В. - Прогнозное моделирование в IBM SPSS Statistics, R и Python: метод деревьев решений и случайный лес - Издательство "ДМК Пресс" - 2018 - 642с. - ISBN: 978-5-97060-539-4 - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/123700
- Язык программирования Python: практикум : учебное пособие / Р.А. Жуков. — Москва : ИНФРА-М, 2020. — 216 с. + Доп. материалы [Электронный ресурс]. — (Среднее профессиональное образование). - Текст : электронный. - URL: http://znanium.com/catalog/product/1044193
Рекомендуемая дополнительная литература
- Маркетинговые исследования с SPSS: Учебное пособие / Г. Моосмюллер, Н.Н. Ребик. - 2-e изд. - М.: ИНФРА-М, 2011. - 200 с.: 60x90 1/16. - (Высшее образование). (обложка) ISBN 978-5-16-004240-4 - Режим доступа: http://znanium.com/catalog/product/257371
- Основы алгоритмизации и программирования на Python : учеб. пособие / С.Р. Гуриков. — М. : ФОРУМ : ИНФРА-М, 2018. — 343 с. — (Среднее профессиональное образование). - Режим доступа: http://znanium.com/catalog/product/961522
- Социальная статистика. Практикум : учеб. пособие для акад. бакалавриата, Бычкова, С. Г., 2014
- Язык программирования Python: практикум : учебное пособие / Р.А. Жуков. — Москва : ИНФРА-М, 2020. — 216 с. + Доп. материалы [Электронный ресурс]. — (Высшее образование: Бакалавриат). — www.dx.doi.org/10.12737/textbook_5cb5ca35aaa7f5.89424805. - Режим доступа: http://znanium.com/catalog/product/1045700