• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
2023/2024

Классификация статистических данных

Статус: Майнор
Когда читается: 3, 4 модуль
Охват аудитории: для всех кампусов НИУ ВШЭ
Язык: русский
Кредиты: 5
Контактные часы: 76

Программа дисциплины

Аннотация

Окружающие нас объекты и явления (например, финансовая деятельность банков или предприятий, доходы респондентов, уровень жизни в странах мира или в отдельно выбранной стране, решение о покупке товаров и т.п.) характеризуются разнообразными признаками и могут быть представлены как точки в многомерном пространстве. В этом пространстве они могут образовывать скопления (группы, кластеры), которые можно изучать в отдельности, выделив специфические свойства и особенности каждой группы. В курсе Вы изучите различные подходы и методы к кластеризации и классификации данных с использованием, как традиционного инструментария, так и современных методов Data Culture, Machine Learning, основы фильтрации изображений. Важной особенностью курса является широкое использование наглядных примеров и применение широкого арсенала современных средств обработки статистической информации (ППП SPSS, среды R, Python), освобождающих исследователя от вычислительной рутины и позволяющих превратить статистическое исследование в увлекательное занятие.
Цель освоения дисциплины

Цель освоения дисциплины

  • Целью освоения дисциплины Сравнительный анализ и классификация данных» является получение студентами основ понимания фундаментальных статистических принципов, роли многомерного статистического инструментария в фундаментальных и прикладных исследованиях. Особенностью курса является наличие большого числа примеров из реальной практики, наглядно демонстрирующих разнообразие областей применения многомерного статистического инструментария, его значимости для различных сфер деятельности. При этом обучение студентов основным графическим и табличным представлениям данных, основам их статистической обработки позволяет сделать результаты расчетов более наглядными и доступными для понимания и интерпретации. Знакомство с возможностями сбора и обработки данных будет опираться как на универсальные информационные технологии, так и на специализированные пакеты прикладных программ (ППП SPSS) и статистические среды (Python, R), а также сопровождаться большим количеством практических примеров и иллюстраций. За счет широкого применения компьютерных технологий в курсе значительное внимание уделяется интерпретации данных и статистических характеристик, получаемых по результатам расчетов.
Планируемые результаты обучения

Планируемые результаты обучения

  • Использует дскриминантный анализ для кластеризации новых объектов. Строит дискриминантные функции, интерпретирует межгрупповые различия. Выбирает показатели, обладающие наибольшей дискриминирующей силой
  • Использует итерационные алгоритмы для решения задач кластеризации объектов
  • Проводит класстеризацию многомерных наблюдений с использованием иерархических и итеративных алгоритмов кластерного анализа. Строит и интерпретирует дендрограммы.
  • Проводит кластеризацию объектов с использованием деревьев решений.
  • Собирает информацию из разных источников, Проводит предварительный анализ данных, Изучает связи между переменными в многомерном пространстве с использованием современных программных продуктов
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Предмет, содержание, задачи курса. Предварительный анализ данных. Основы корреляционного анализа
  • Кластеризация многомерных наблюдений. Кластерный анализ
  • Кластеризация многомерных наблюдений с обучением. Основы дискриминантного анализа
  • Деревья решений, случайные леса, нейросети
Элементы контроля

Элементы контроля

  • неблокирующий Текущая работа
    Выполнение текущих заданий
  • неблокирующий Компьютерная работа 1
    Расчетное задание
  • неблокирующий Компьютерная работа 2
    Расчетное задание
  • неблокирующий Самостоятельная работа
    Самостоятельная работа
  • неблокирующий Контрольная работа
    Контрольная работа
Промежуточная аттестация

Промежуточная аттестация

  • 2023/2024 учебный год 4 модуль
    0.2 * Компьютерная работа 1 + 0.2 * Компьютерная работа 2 + 0.25 * Контрольная работа + 0.1 * Самостоятельная работа + 0.15 * Текущая работа + 0.1 * Текущая работа
Список литературы

Список литературы

Рекомендуемая основная литература

  • Meyers, L. S. (2013). Performing Data Analysis Using IBM SPSS. Hoboken: Wiley. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=610849
  • Груздев, А. В. Прогнозное моделирование в IBM SPSS Statistics, R и Python: метод деревьев решений и случайный лес : руководство / А. В. Груздев. — Москва : ДМК Пресс, 2018. — 642 с. — ISBN 978-5-97060-539-4. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/123700 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
  • Прикладная статистика. Основы эконометрики. Т.1: Теория вероятностей и прикладная статистика, Айвазян, С. А., 2001
  • Язык программирования Python: практикум : учебное пособие / Р.А. Жуков. — Москва : ИНФРА-М, 2020. — 216 с. + Доп. материалы [Электронный ресурс]. — (Среднее профессиональное образование). - Текст : электронный. - URL: http://znanium.com/catalog/product/1044193

Рекомендуемая дополнительная литература

  • Маркетинговые исследования с SPSS: Учебное пособие / Г. Моосмюллер, Н.Н. Ребик. - 2-e изд. - М.: ИНФРА-М, 2011. - 200 с.: 60x90 1/16. - (Высшее образование). (обложка) ISBN 978-5-16-004240-4 - Режим доступа: http://znanium.com/catalog/product/257371
  • Основы алгоритмизации и программирования на Python : учеб. пособие / С.Р. Гуриков. — М. : ФОРУМ : ИНФРА-М, 2018. — 343 с. — (Среднее профессиональное образование). - Режим доступа: http://znanium.com/catalog/product/961522
  • Социальная статистика. Практикум : учеб. пособие для акад. бакалавриата, Бычкова, С. Г., 2014
  • Язык программирования Python: практикум : учебное пособие / Р.А. Жуков. — Москва : ИНФРА-М, 2020. — 216 с. + Доп. материалы [Электронный ресурс]. — (Высшее образование: Бакалавриат). — www.dx.doi.org/10.12737/textbook_5cb5ca35aaa7f5.89424805. - Режим доступа: http://znanium.com/catalog/product/1045700