Бакалавриат
2022/2023
Теория вероятностей и математическая статистика
Лучший по критерию «Новизна полученных знаний»
Статус:
Курс обязательный (Клеточная и молекулярная биотехнология)
Направление:
06.03.01. Биология
Кто читает:
Базовая кафедра Института биоорганической химии им. академиков М.М. Шемякина и Ю.А. Овчинникова РАН
Где читается:
Факультет биологии и биотехнологии
Когда читается:
2-й курс, 1, 2 модуль
Формат изучения:
без онлайн-курса
Охват аудитории:
для своего кампуса
Язык:
русский
Кредиты:
4
Контактные часы:
60
Программа дисциплины
Аннотация
В результате освоения дисциплины студент должен уметь применять изученные в рамках дисциплины методы анализа данных к решению содержательных социально-экономических и политологических задач. Изучение данной дисциплины базируется на знаниях и навыках, полученных в рамках курса «Математика и статистика» (1 курс). Для освоения учебной дисциплины, студенты должны владеть следующими знаниями и компетенциями: Знать содержательный смысл следующих понятий: функция, производная, интеграл; функция распределения и функция плотности вероятности, условная вероятность, математическое ожидание и дисперсия, квантиль, корреляция. Знать основы теории статистического оценивания и теории проверки статистических гипотез в объеме дисциплины «Математика и статистика» (1 курс). Уметь дифференцировать и вычислять определенный интеграл элементарных функций.
Цель освоения дисциплины
- овладеть знаниями в области теории вероятностей и математической статистики, необходимыми для освоения базовых методов анализа данных в социальных науках.
Планируемые результаты обучения
- Знает допущения классической линейной регрессии
- Знает критерии качества регрессионных моделей, умеет выбирать релевантную модель на основе информационных критериев
- Знает сферу применения дисперсионного анализа
- Корректно интерпретирует оценки коэффициентов множественной регрессии, понимает потенциальные источники мультиколлинеарности
- Понимает различия между точечными и интервальными оценками, корректно интерпретирует доверительные интервалы, знает свойства точечных оценок
- Умеет выводить оценки коэффициентов в модели парной регрессии, корректно интерпретирует полученные оценки
- Умеет выявлять влиятельные и нетипичные наблюдения
- Умеет диагностировать гетероскедастичность и знает, какие поправки вносить в модель в условиях гетероскедастичности
- Умеет получать оценки параметров методом максимального правдоподобия
- Умеет получать оценки параметров методом моментов
- Умеет при помощи Rstudio готовить данные к последующему анализу
- Умеет проверять гипотезу о равенстве средних двух независимых выборок из нормального распределения
- Умеет проверять статистические гипотезы при помощи p-value
- Умеет рассчитать условное математическое ожидание, знает сферы применения экспоненциального распределения и распределения Пуассона
- Умеет рассчитывать и корректно интерпретировать величины ошибки I, II рода и мощности в рамках проверки гипотез
- Умеет решать задачу о 2-х и более независимых выборок при помощи непараметрических критериев
- Умеет строить доверительный интервал для дисперсии
- Умеет строить доверительный интервал для разности средних двух независимых нормальных выборок
Содержание учебной дисциплины
- Распределение вероятностей дискретных и непрерывных случайных величин. Условное распределение и условное математическое ожидание
- Точечные оценки
- Понятие интервальной оценки. Распределение хи-квадрат. Распределение выборочной оценки дисперсии с нормальной выборкой
- Распределение Стьюдента. Распределение стьюдентовской дроби (с доказательством). Доверительный интервал для разности средних двух независимых нормальных выборок
- Подготовка данных к анализу
- Проверка гипотез.
- Параметрическая задача о 2 независимых выборках: критерий Стьюдента. Двойственность с доверительным интервалом для разности средних. Проблема Беренса-Фишера. Модель дисперсионного анализа. МНК-оценка параметров модели. Проверка гипотез о параметрах.
- Непараметрический подход к задаче о 2 и k независимых выборках: критерий Уилкоксона и Краскела-Уоллиса
- Парная регрессия: постановка задачи, МНК-оценки, проверка гипотезы про коэффициенты. Теорема Гаусса-Маркова и теорема Рао о свойствах МНК-оценок. Статистический вывод в регрессии: статистическая значимость коэффициентов. Критерии качества моделей, сравнение моделей. Разложение вариации.
- Модель множественной линейной регрессии
- Гетероскедастичность
- Нетипичные и влиятельные наблюдения
- Критерии качества регрессионных моделей. Выбор модели
Промежуточная аттестация
- 2022/2023 учебный год 2 модуль0.5 * Экзамен_Модуль 1 + 0.25 * Контрольная работа №1 + 0.25 * Контрольная работа №2
Список литературы
Рекомендуемая основная литература
- Путеводитель по современной эконометрике : учеб.- метод. пособие для вузов, Вербик, М., 2008
Рекомендуемая дополнительная литература
- Introductory econometrics: a modern approach, Wooldridge, J.M., 2016
- Larocca, R. (2005). Reconciling Conflicting Gauss-Markov Conditions in the Classical Linear Regression Model. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsbas&AN=edsbas.343D1CB
- WORKSHOP How Not to Lie with Statistics: Avoiding Common Mistakes in Quantitative Political Science *. (n.d.). Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsbas&AN=edsbas.E7A759A2