Мы используем файлы cookies для улучшения работы сайта НИУ ВШЭ и большего удобства его использования. Более подробную информацию об использовании файлов cookies можно найти здесь, наши правила обработки персональных данных – здесь. Продолжая пользоваться сайтом, вы подтверждаете, что были проинформированы об использовании файлов cookies сайтом НИУ ВШЭ и согласны с нашими правилами обработки персональных данных. Вы можете отключить файлы cookies в настройках Вашего браузера.

  • A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Бакалавриат 2020/2021

Анализ категориальных данных в статистических пакетах

Лучший по критерию «Полезность курса для Вашей будущей карьеры»
Статус: Курс по выбору (Политология)
Направление: 41.03.04. Политология
Когда читается: 3-й курс, 3, 4 модуль
Формат изучения: без онлайн-курса
Язык: русский
Кредиты: 4
Контактные часы: 56

Программа дисциплины

Аннотация

Освоение дисциплины «Анализ категориальных данных в статистических пакетах» позволяет получить базовые знания и навыки по применению ряда популярных методов к решению задач, связанных с анализом эмпирических данных, в том случае, когда зависимая переменная измерена в порядковой или номинальной шкале. Например, для изучения того, какие индивидуальные характеристики могут повлиять на то, ходит ли человек на выборы, за кого он голосует. Курс охватывает модели бинарного выбора, модели множественного выбора с упорядоченным откликом (порядковая логистическая регрессия), а также мультиномиальные регрессионные модели. На занятиях используется RStudio для отработки применения изученных методов.
Цель освоения дисциплины

Цель освоения дисциплины

  • Выработка компетенций по решению политологических и социально-экономических задач, связанных с анализом данных в том случае, когда изучаемые зависимые признаки имеют дискретную природу.
Планируемые результаты обучения

Планируемые результаты обучения

  • уметь применять основные модели бинарного и множественного выбора, уметь корректно интерпретировать и визуализировать результаты их оценивания
  • владеть навыками реализации моделей бинарного и множественного выбора в статистических пакетах (Rstudio)
Содержание учебной дисциплины

Содержание учебной дисциплины

  • 1.1 Линейная модель регрессии
    Дискретные зависимые переменные. Латентный признак и наблюдаемые исходы. Линейная вероятностная моделью
  • 1.2. Логистическая регрессия
    Оценивание моделейс дискретными зависимыми переменными. Метод максимального правдоподобия (ММП). Модели бинарного выбора: логистическая регрессия (логит-модель) и пробит-модель. Условия на ошибки моделей бинарного выбора. Интерпретация коэффициентов логистической регрессии при непрерывных и категориальных переменных. Шансы и отношения шансов. Предсказанные вероятности. До верительные интервалы. Графическое представление результатов. Сравнение коэффициентов логит - и пробит-моделей.
  • 1.3. Проверка гипотез.
    Проверка гипотез о линейных ограничениях на коэффициенты: тест Вальда, тест отношения правдоподобия. Проверка гипотез об адекватности модели (критерии качества модели), сравнение моделей. (pseudo-R2, AIC, BIC). Анализ остатков модели. Выявление нетипичных наблюдений.
  • 2. Модели множественного неупорядоченного выбора.
    Номинальные переменные. Мультиномиальная логистическая регрессия. Интерпретация коэффициентов мультиномиальной логистической регрессии. Условная логистическая регрессия (Conditional logit). Предположение о независимости от посторонних альтернатив.
  • 3. Модели множественного упорядоченного выбора.
    Порядковые переменные. Порядковая логистическая регрессия. Оценивание порядковой логистической регрессии. Интерпретация коэффициентов порядковой логистической регрессии. Предположение о параллельности регрессий: тест Бранта. Обобщенная модель множественного упорядоченного выбора (Generalized ordered logit) / частичная модель пропорциональных шансов (Partial proportional odds model).
Элементы контроля

Элементы контроля

  • неблокирующий Домашние задания
  • неблокирующий Самостоятельные работы
  • неблокирующий Эссе
  • неблокирующий Контрольная работа
  • неблокирующий Экзаменационная работа
Промежуточная аттестация

Промежуточная аттестация

  • Промежуточная аттестация (4 модуль)
    0.15 * Домашние задания + 0.15 * Контрольная работа + 0.15 * Самостоятельные работы + 0.3 * Экзаменационная работа + 0.25 * Эссе
Список литературы

Список литературы

Рекомендуемая основная литература

  • Прикладная статистика и основы эконометрики : учебник для вузов, Айвазян, С. А., 1998

Рекомендуемая дополнительная литература

  • Путеводитель по современной эконометрике : учеб.- метод. пособие для вузов, Вербик, М., 2008