We use cookies in order to improve the quality and usability of the HSE website. More information about the use of cookies is available here, and the regulations on processing personal data can be found here. By continuing to use the site, you hereby confirm that you have been informed of the use of cookies by the HSE website and agree with our rules for processing personal data. You may disable cookies in your browser settings.

  • A
  • A
  • A
  • ABC
  • ABC
  • ABC
  • А
  • А
  • А
  • А
  • А
Regular version of the site

Analysis of Heterogeneous Data and Data Pattern Analysis

2024/2025
Academic Year
RUS
Instruction in Russian
6
ECTS credits
Delivered at:
Department of Higher Mathematics (Independent HSE Departments)
Course type:
Compulsory course
When:
1 year, 3, 4 module

Instructors

Программа дисциплины

Аннотация

Чаще всего в социальных науках, в частности, в политологии, исследователям приходится работать с неоднородными данными. Примером могут выступать данные с панельной структурой (наличие как пространственного, так и временного измерения: данные по каждой стране из выборки представлены за несколько лет), с иерархической структурой (к примеру, в массиве представлены данные на индивидуальном и страновом уровне). В таком случае предположение об одинаковых параметрах для всех единиц анализа является неправдоподобным. Допустим, взаимосвязь между протестной активностью и доходом может быть разного характера в разных странах. Оценивание классической модели линейной регрессии в таком случае приводит к некорректным результатам статистической инференции. Курс «Методы анализа неоднородных данных и паттерн-анализ» посвящен изучению количественных методов, позволяющих учесть отсутствие независимости наблюдений в подгруппах выборки. Будут рассмотрены и критически проанализированы следующие методы: 1) корректировка с помощью робастных стандартных ошибок 2) регрессионный анализ на подвыборках 3) регрессионный анализ с включением переменных взаимодействия 4) моделирование с фиксированными эффектами 5) моделирование со смешанными эффектами, в частности, многоуровневое моделирование. Программное обеспечение – Python. Преподавателем будут предложены конкретные исследования для обсуждения методологического подхода и соответствующие массивы данных для репликации результатов.
Цель освоения дисциплины

Цель освоения дисциплины

  • овладение статистическими методами, позволяющих учесть отсутствие независимости наблюдений в подгруппах выборки, для решения политологических и социально-экономических задач
Планируемые результаты обучения

Планируемые результаты обучения

  • Знает возможные стратегии работы с неоднородными данными и знает их область применения, корректно применяет и интерпретирует оценки моделей с переменными взаимодействия
  • Корректно интерпретирует оценки коэффициентов в моделях со смешанными эффектами, понимает различие между фиксированными и случайными эффектами в контексте модели со смешанными эффектами
  • Корректно интерпретирует результаты оценивания модели с фиксированными эффектами, знает область применения модели с фиксированными эффектами
  • Умеет выбрать и обосновать спецификацию модели со смешанными эффектами для анализа панельных данных, корректно интерпретирует оценки коэффициентов в моделях со смешанными эффектами
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Введение: основы работы с гетерогенной выборкой
  • Модели с фиксированными эффектами: возможности и ограничения
  • Модели со смешанными эффектами. Сравнение альтернативных подходов к работе с гетерогенной выборкой
  • Анализ панельных данных при помощи моделей со смешанными эффектами
  • Методы анализа паттернов
Элементы контроля

Элементы контроля

  • неблокирующий Проверочная работа 3
  • неблокирующий Проверочная работа 2
  • неблокирующий Семинарская активность
  • неблокирующий Экзамен
  • неблокирующий Домашние задания
  • неблокирующий Эссе
  • неблокирующий Проверочная работа 1
Промежуточная аттестация

Промежуточная аттестация

  • 2024/2025 4th module
    0.1 * Домашние задания + 0.1 * Проверочная работа 1 + 0.1 * Проверочная работа 2 + 0.1 * Проверочная работа 3 + 0.1 * Семинарская активность + 0.3 * Экзамен + 0.2 * Эссе
Список литературы

Список литературы

Рекомендуемая основная литература

  • Bradford S. Jones, & Marco R. Steenbergen. (1997). Modeling Multilevel Data Structures. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsbas&AN=edsbas.F4700E2E
  • Econometric analysis of cross section and panel data, Wooldridge, J. M., 2002
  • Анализ панельных данных и данных о длительности состояний : учеб. пособие, Ратникова, Т. А., 2014

Рекомендуемая дополнительная литература

  • Green, D. P., Kim, S. Y., & Yoon, D. H. (2001). Dirty Pool. International Organization, (02), 441. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsrep&AN=edsrep.a.cup.intorg.v55y2001i02p441.468.44
  • Hainmueller, J., Mummolo, J., & Xu, Y. (2019). How Much Should We Trust Estimates from Multiplicative Interaction Models? Simple Tools to Improve Empirical Practice. Political Analysis, (02), 163. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsrep&AN=edsrep.a.cup.polals.v27y2019i02p163.192.00

Авторы

  • Сальникова Дарья Вячеславовна