• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
2020/2021

Классификация статистических данных

Статус: Майнор
Когда читается: 3, 4 модуль
Преподаватели: Антонян Анна Артуровна, Балычева Юлия Евгеньевна, Богомолова Полина Максимовна, Васильев Денис Филиппович, Звездина Наталья Валерьевна, Максимова Маргарита Максимовна
Язык: русский
Кредиты: 5
Контактные часы: 76

Программа дисциплины

Аннотация

Целью курса является изучение основных направлений развития современных методов кластеризации объектов, среди которых иерархические и итерационные алгоритмы кластерного анализа, параметрическая и непараметрическая классификация, деревья решений и случайные леса. Важной особенностью курса является широкое использование наглядных примеров и применение широкого арсенала современных средств обработки статистической информации (например, в ППП SPSS, средах R, Python), освобождающих исследователя от вычислительной рутины и позволяющих превратить статистическое исследование в увлекательное занятие.
Цель освоения дисциплины

Цель освоения дисциплины

  • Целью освоения дисциплины Сравнительный анализ и классификация данных» является получение студентами основ понимания фундаментальных статистических принципов, роли многомерного статистического инструментария в фундаментальных и прикладных исследованиях. Особенностью курса является наличие большого числа примеров из реальной практи-ки, наглядно демонстрирующих разнообразие областей применения многомерного статисти-ческого инструментария, его значимости для различных сфер деятельности. При этом обуче-ние студентов основным графическим и табличным представлениям данных, основам их статистической обработки позволяет сделать результаты расчетов более наглядными и доступными для понимания и интерпретации. Знакомство с возможностями сбора и обработки данных будет опираться как на уни-версальные информационные технологии, так и на специализированные пакеты прикладных программ (ППП SPSS), а также сопровождаться большим количеством практических приме-ров и иллюстраций. За счет широкого применения компьютерных технологий в курсе значительное внима-ние уделяется интерпретации данных и статистических характеристик, получаемых по ре-зультатам расчетов.
Планируемые результаты обучения

Планируемые результаты обучения

  • Собирает информацию из разных источников, Проводит предварительный анализ данных, Изучает связи между переменными в многомерном пространстве с использованием современных программных продуктов
  • Проводит класстеризацию многомерных наблюдений с использованием иерархических и итеративных алгоритмов кластерного анализа. Строит и интерпретирует дендрограммы.
  • Использует итерационные алгоритмы для решения задач кластеризации объектов
  • Использует дскриминантный анализ для кластеризации новых объектов. Строит дискриминантные функции, интерпретирует межгрупповые различия. Выбирает показатели, обладающие наибольшей дискриминирующей силой
  • Проводит кластеризацию объектов с использованием деревьев решений.
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Предмет, содержание, задачи курса. Предварительный анализ данных. Основы корреляционного анализа
  • Кластеризация многомерных наблюдений. Кластерный анализ
  • Кластеризация многомерных наблюдений с обучением. Основы дискриминантного анализа
  • Деревья решений, случайные леса, нейросети
Элементы контроля

Элементы контроля

  • неблокирующий Модульная работа 1
  • неблокирующий Модульная работа 2
  • неблокирующий Активность на семинарах
  • неблокирующий Самостоятельная работа на лекциях
  • неблокирующий Экзамен
Промежуточная аттестация

Промежуточная аттестация

  • Промежуточная аттестация (4 модуль)
    0.2 * Активность на семинарах + 0.2 * Модульная работа 1 + 0.2 * Модульная работа 2 + 0.1 * Самостоятельная работа на лекциях + 0.3 * Экзамен
Список литературы

Список литературы

Рекомендуемая основная литература

  • Meyers, L. S. (2013). Performing Data Analysis Using IBM SPSS. Hoboken: Wiley. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=610849
  • Груздев А.В. - Прогнозное моделирование в IBM SPSS Statistics, R и Python: метод деревьев решений и случайный лес - Издательство "ДМК Пресс" - 2018 - 642с. - ISBN: 978-5-97060-539-4 - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/123700
  • Язык программирования Python: практикум : учебное пособие / Р.А. Жуков. — Москва : ИНФРА-М, 2020. — 216 с. + Доп. материалы [Электронный ресурс]. — (Среднее профессиональное образование). - Текст : электронный. - URL: http://znanium.com/catalog/product/1044193

Рекомендуемая дополнительная литература

  • Маркетинговые исследования с SPSS: Учебное пособие / Г. Моосмюллер, Н.Н. Ребик. - 2-e изд. - М.: ИНФРА-М, 2011. - 200 с.: 60x90 1/16. - (Высшее образование). (обложка) ISBN 978-5-16-004240-4 - Режим доступа: http://znanium.com/catalog/product/257371
  • Основы алгоритмизации и программирования на Python : учеб. пособие / С.Р. Гуриков. — М. : ФОРУМ : ИНФРА-М, 2018. — 343 с. — (Среднее профессиональное образование). - Режим доступа: http://znanium.com/catalog/product/961522
  • Социальная статистика. Практикум : учеб. пособие для акад. бакалавриата, Бычкова, С. Г., 2014
  • Язык программирования Python: практикум : учебное пособие / Р.А. Жуков. — Москва : ИНФРА-М, 2020. — 216 с. + Доп. материалы [Электронный ресурс]. — (Высшее образование: Бакалавриат). — www.dx.doi.org/10.12737/textbook_5cb5ca35aaa7f5.89424805. - Режим доступа: http://znanium.com/catalog/product/1045700