Магистратура
2020/2021
Основы теории вероятностей и математической статистики
Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Лучший по критерию «Новизна полученных знаний»
Статус:
Курс адаптационный (Коммуникации в государственных структурах и НКО)
Направление:
42.04.01. Реклама и связи с общественностью
Кто читает:
Кафедра высшей математики
Где читается:
Факультет креативных индустрий
Когда читается:
1-й курс, 1 модуль
Формат изучения:
без онлайн-курса
Преподаватели:
Тамбовцева Алла Андреевна
Прогр. обучения:
Коммуникации в государственных структурах и НКО
Язык:
русский
Кредиты:
3
Контактные часы:
32
Программа дисциплины
Аннотация
В результате освоения дисциплины будут получены знания об основных понятиях теории вероятностей, математической статистики, методах статистического анализа данных в прикладных задачах в пределах программы курса; базовые навыки «прочтения» и содержательной интерпретации статистических данных, специфика применения вероятностно-статистического подхода.
Цель освоения дисциплины
- Целью освоения дисциплины является формирование навыков визуализации и анализа данных, а также умения интерпретировать полученные статистические результаты.
Планируемые результаты обучения
- уметь различать шкалы данных и знать особенности работы с данными, измеренными в различных шкалах
- уметь описывать данные, измеренные в различных шкалах, используя методы описательной статистики
- владеть навыками визуализации данных различных типов
- уметь интерпретировать результаты, полученные в ходе разведывательного анализа данных
- уметь реализовывать разведывательный анализ одной и нескольких переменных
- знать индексы, применяемые в социальных науках, их особенности и ограничения
- владеть основной терминологией теории вероятностей и статистики
- знать логику проведения статистического исследования
- знать устройство регрессионных моделей и понимать их применимость в контексте прикладных задач
- знать логику реализации кластерного анализа и понимать его применимость при решении практических задач
- знать логику реализации метода главных компонент и понимать его применимость для построения индексов в сфере коммуникаций
Содержание учебной дисциплины
- Введение в анализ данныхПредставление данных: наблюдения и переменные. Шкалы данных: абсолютная, интервальная, порядковая, номинальная. Примеры индексов, используемых в социальных науках: индекс восприятия коррупции от Transparency International, индексы проекта Polity, индексы проекта Freedom House. Преобразование данных. Логарифмированная шкала и примеры ее использования.
- Разведывательный анализ данныхОписание данных: описательные статистики для данных разных типов. Минимальное и максимальное значение, размах. Среднее арифметическое и взвешенное среднее. Медиана, квантили и квартили. Примеры использования квантилей: децили в индексах экономического неравенства. Описание данных в номинальной шкале: абсолютные и относительные частоты. Визуализация распределения количественных данных: гистограмма и сглаженный график плотности распределения. Визуализация распределения качественных данных: столбиковая и круговая диаграммы. Визуализация динамики показателей. Поиск нетипичных значений в количественных данных. График «ящик с усами». Работа с пропущенными значениями: поиск и заполнение. Визуализация совместного распределения двух переменных: диаграмма рассеяния. Коэффициенты корреляции Пирсона и Спирмена. Корреляционные матрицы и тепловые карты (heat maps).
- Основы теории вероятностейСлучайный эксперимент и элементарный исход. Случайные события и действия с ними. Вероятности случайных событий. Независимость событий. Условная вероятность. Формула Байеса. Дискретные случайные величины. Ряд распределения. Математическое ожидание, дисперсия и стандартное отклонение случайной величины. Непрерывные случайные величины. Нормальное распределение. Экспоненциальное распределение.
- Статистический выводПланирование статистического исследования: генеральная совокупность и выборка. Репрезентативность выборки. Статистическая оценка как случайная величина. Закон больших чисел и центральная предельная теорема. Доверительный интервал и предельная ошибка выборки (погрешность). Статистические критерии и pvalue. Примеры статистических критериев: сравнение средних двух и более выборок. Выявление связи между переменными в количественной и порядковой шкале: проверка значимости коэффициентов корреляции. Выявление связи между переменными в качественной шкале: таблицы сопряженности и критерий хи-квадрат.
- Регрессионный анализПонятие регрессионной модели: зависимая и независимая переменная. Парная линейная регрессия. Проверка качества модели и коэффициент детерминации R-квадрат. Множественная линейная регрессия. Потенциальные проблемы модели и методы борьбы с ними. Логистическая регрессия. Коэффициенты модели и отношение шансов. Предсказательная сила и ошибки модели. Оценка качества логистической модели.
- Кластерный анализКластерный анализ в социальных науках: примеры использования. Иерархический кластерный анализ: расстояния и методы агрегирования. Дендрограмма. Кластеризация методом К-средних. Оценка качества кластеризации.
- Метод главных компонентМетод главных компонент в социальных науках: примеры использования. Логика метода главных компонент и его геометрическая интерпретация. Построение индексов на основе имеющихся данных с помощью метода главных компонент.
Элементы контроля
- Домашние заданияДомашние задания представляют собой набор закрытых и открытых вопросов по пройденному материалу, в зависимости от разбираемых тем могут включать задачи по теории вероятностей и статистике, задачи на интерпретацию графиков и статистических выдач, практические задачи, требующие использование Google Tables.
- ЭкзаменЭкзамен представляет собой набор закрытых тестовых вопросов, открытых вопросов разного типа, заданий на интерпретацию графиков и статистических выдач, задач по основам теории вероятностей. На экзамене студенту запрещается использовать материалы, кроме заранее подготовленного листа А4 с необходимой информацией, написанного своей рукой (не ксерокопия или лист другого студента, лист может быть исписан с двух сторон).
Список литературы
Рекомендуемая основная литература
- AP statistics, Sternstein, M., 2013
- Анализ данных на компьютере : учеб. пособие, Тюрин, Ю. Н., 2008
- Задачник по теории вероятностей для студентов социально - гуманитарных специальностей, Макаров, А. А., 2015
Рекомендуемая дополнительная литература
- Agresti, A. (2013). Categorical Data Analysis (Vol. Third edition). Hoboken, NJ: Wiley. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=769330
- Bruce, P. C., & Bruce, A. (2017). Practical Statistics for Data Scientists : 50 Essential Concepts (Vol. First edition). Sebastopol, CA: O’Reilly Media. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=nlebk&AN=1517577