• A
  • A
  • A
  • ABC
  • ABC
  • ABC
  • А
  • А
  • А
  • А
  • А
Regular version of the site

Bayesian Statistics

2024/2025
Academic Year
RUS
Instruction in Russian
6
ECTS credits
Course type:
Compulsory course
When:
2 year, 1, 2 module

Instructor


Беленков Вадим Евгеньевич

Программа дисциплины

Аннотация

В этом курсе студенты изучают как теоретические основы байесовского статистического анализа, так и ключевые направления прикладного использования байесовских методов. Основным содержанием курса является применение байесовской методологии для выявления связей между переменными в опросных и иных данных, операционализации сложных концептов политической науки (латентных переменных), а также анализ данных с иерархической структурой. Студенты получат навыки применения методов байесовской статистики с помощью языка программирования Python.
Цель освоения дисциплины

Цель освоения дисциплины

  • Овладение навыками применения методов байесовской статистики для решения широкого круга исследовательских задач
Планируемые результаты обучения

Планируемые результаты обучения

  • ПРО 1. Формулировать содержание и функции методов байесовской статистики.
  • ПРО 2. Интерпретировать результаты, полученные в ходе анализа данных с помощью методов байесовской статистики.
  • ПРО 3. Применять необходимые наборы библиотек и команд на языке программирования R для анализа данных с помощью методов байесовской статистики.
  • ПРО 4. Выявлять апостериорные распределения параметров, отражающих связи между переменными, латетных переменных.
  • ПРО 5. Обобщать результаты анализа данных посредством байесовских методов и аргументировать выводы исследования.
  • ПРО 6. Проектировать и реализовывать своё политическое исследование с использованием методов байесовской статистики.
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Тема 1. Введение в байесовскую статистику
  • Тема 2. Аналитический подход к оценке параметров
  • Тема 3. Симуляционные методы в байесовской статистике
  • Тема 4. Применение симуляционных методов в регрессионном анализе
  • Тема 5. Байесовские методы заполнения пропущенных значений переменных
  • Тема 6. Иерархическое моделирование в байесовской статистике
  • Тема 7. Байесовские методы измерения латентных переменных
Элементы контроля

Элементы контроля

  • неблокирующий Домашние задания
    Итоговая оценка за домашние задания - это среднее оценок двух домашних заданий. При выполнении домашних заданий запрещается использовать генеративные модели искусственного интеллекта (Chat GPT и его аналоги)
  • неблокирующий Проект по репликации частотного анализа с помощью методов байесовской статистики
    Студентам предстоит воспроизвести результаты научного исследования, в котором применялись методы классической (частотной) статистики, а также провести на основе данных из этого исследования свой анализ с помощью методов байесовской статистики. Научное исследование должно быть взято из статьи, опубликованной за последние 5 лет в одном из ведущих мировых политологических журналов (список A НИУ ВШЭ по политическим наукам, Q1 WoS или Q1 Scopus по политическим наукам). Студенты будут должны: 1) найти исследование, а также данные и код для его репликации; 2) повторить анализ с помощью методов классической стастистики и подтвердить (или опровергнуть) результат; 3) провести новый анализ тех же данных, но с использованием методов байесовской статистики. Студенты должны будут до заданного преподавателем срока (примерно начало октября) прислать письменное обоснование дизайна работы с кратким описанием планируемой работы (с указанием статистических методов и спецификаций моделей) и источников данных. Окончательный письменный отчёт должен быть отправлен примерно до конца первого модуля (точный срок будет установлен преподавателем отдельно). Он должен содержать следующие разделы: 1) введение; 2) описание данных; 3) описание модели; 4) результаты; 5) заключение. Во введении нужно представить дизайн своего исследования. Во втором разделе нужно описать данные и представить описательные статистики. В третьем разделе нужно обсудить и частотную, и байесовскую модель, обосновав выбор модели. В четвёртом разделе нужно сравнить результаты частотного и байесовского анализа данных. В заключении надо сделать выводы о том, какая модель и какие методы привели к более убедительным результатам. К отчёту нужно добавить приложение, где должны быть представлены диагностики байесовской модели. Также студенты должны предоставить аннотированный код для репликации (включая код для байесовской модели) своей работы и данные. В ноябре (точный срок будет установлен преподавателем отдельно) студенты выступят с десятиминутной презентацией в защиту своей работы и своих результатов в рамках этого проекта. После этого пройдёт пятиминутное выступление рецензента из числа одногруппников. Рецензенты должны реплицировать анализ своей коллег до своего выступления, используя предоставленный код. Они обязательно должны прокомментировать использованные методы моделирования, их применимость и качество реализации, а также результаты диагностик. Рецензия устная. После выступления рецензентов будет организована сессия вопросов и ответов. Учитывая, что оценка за репликационный проект составляет 30% итоговой оценки за курс, вклад оценок за элементы работы в рамках проекта в итоговую оценку за курс выглядит следующим образом: 20%*Оценка за собственный репликационный проект+ 10%*Комментарии в качестве рецензента. В случае, если студент не представит своевременно без уважительной причины как минимум один из указанных материалов (письменное обоснование дизайна работы, окончательный письменный отчёт, код для репликации байесовской модели, данные) и/или не выступит с презентацией в защиту своего проекта, оценка собственного репликационного, оценка за собственный репликационный проект не может быть выше 3 баллов из 10 . В случае, если результаты исполнения кода будут отличаться (за исключением отклонений, вызванных случайными реализациями) от представленных в выступлении с презентацией и/или окончательном письменном отчёте, оценка за собственный репликационный проект не может быть выше 3 баллов из 10. При выполнении проекта по репликации частотного анализа с помощью методов байесовской статистики запрещается использовать генеративные модели искусственного интеллекта (Chat GPT и его аналоги).
  • неблокирующий Экзамен (финальный проект)
    У студентов есть два варианта выполнения финального проекта. Первый вариант – существенно расширить свой проект по репликации, добавив дополнительные байесовские методы анализа данных (теоретически обоснованные априорные распределения, заполнение пропущенных значений с помощью методов байесовской статистики, байесовские иерархические модели, модели латентных переменных). Второй вариант – провести полностью самостоятельное исследование с использованием методов байесовской статистики. Письменное обоснование планируемого дизайна финального проекта должно быть отправлено преподавателю курса до конца ноября (более точный срок будет установлен преподавателем отдельно). Итоговый письменный отчёт о реализации финального проекта должен быть отправлен до середины декабря (более точный срок будет установлен преподавателем отдельно) . Структура отчёта о финальном проекте и требования к его объёму такие же как для отчёта о репликационном проекте. К письменному отчёту должны быть приложены данные и код для репликации. Если студент выбрал вариант расширить репликационный проект, объём текста должен быть не менее, чем в 1,5 раза больше, чем объём репликационного проекта студента. В ходе сессии студенты должны будут защитить результаты своего проекта, выступив с докладом о нём. Также студенты должны будут представить письменную рецензию на работу своего одногруппника объёмом не менее 500 слов не позднее, чем за два дня до защиты результатов проекта. Учитывая, что вес оценки за финальный проект составляет 30% итоговой оценки, вклад собственного финального проекта и рецензии на проект другого студента в итоговую оценку за курс выглядит следующим образом : 20%*Собственный финальный проект+ 10%*Рецензия на работу другого студента. В случае, если студент не представит код репликации или данные для своей работы, оценка за собственный финальный проект не может быть выше трёх баллов из 10. В случае, если результаты исполнения кода будут отличаться (за исключением отклонений, вызванных случайными реализациями) от представленных в выступлении с презентацией и/или окончательном письменном отчёте, оценка за собственный финальный проект не может быть выше 3 баллов из 10. При выполнении финального проекта запрещается использовать генеративные модели искусственного интеллекта (Chat GPT и его аналоги).
Промежуточная аттестация

Промежуточная аттестация

  • 2024/2025 2nd module
    0.4 * Домашние задания + 0.3 * Проект по репликации частотного анализа с помощью методов байесовской статистики + 0.3 * Экзамен (финальный проект)
Список литературы

Список литературы

Рекомендуемая основная литература

  • Bayesian analysis for the social sciences, Jackman, S., 2009

Рекомендуемая дополнительная литература

  • Bayesian data analysis, Gelman, A., 2014

Авторы

  • Беленков Вадим Евгеньевич