Магистратура
2020/2021
Прикладной статистический анализ
Лучший по критерию «Полезность курса для Вашей будущей карьеры»
Лучший по критерию «Полезность курса для расширения кругозора и разностороннего развития»
Лучший по критерию «Новизна полученных знаний»
Статус:
Курс по выбору (Демография)
Направление:
39.04.01. Социология
Кто читает:
Кафедра демографии
Где читается:
Факультет социальных наук
Когда читается:
2-й курс, 1, 2 модуль
Формат изучения:
без онлайн-курса
Преподаватели:
Зангиева Ирина Казбековна,
Митрофанова Екатерина Сергеевна,
Сулейманова Анна Наильевна
Прогр. обучения:
Демография
Язык:
русский
Кредиты:
4
Контактные часы:
50
Программа дисциплины
Аннотация
Дисциплина «Прикладной статистический анализ» преследует следующие цели: помочь студентам сориентироваться в многообразии методов статистического анализа данных и научиться корректно применить выбранные методы. Наряду с уже известными методами статистического анализа (таблицы сопряженности, корреляционный и регрессионный анализ и т.д.) в ходе обучения будут представлены новые методы анализа, не встречавшиеся в предыдущих дисциплинах: модели деревьев решений, event history analysis, sequence analysis и другие методы. Отдельный фокус будет сделан на анализе биографических событий (микроданные) и способах визуализации результатов. Курс носит прикладной, практический характер. Он поможет структурировать ранее полученные знания, усовершенствовать навыки работы в таких программах как IBM SPSS, R, MS Excel, MS Word. В рамках курса предполагается выполнение двух домашних заданий и двух контрольных работ. Итоговый экзамен отсутствует. Оценка за курс выставляется на основании оценок за указанные работы.
Цель освоения дисциплины
- Помочь студентам сориентироваться в многообразии методов статистического анализа данных и корректно применить выбранные методы
- Структурировать ранее полученные знания, усовершенствовать навыки работы в таких программах как SPSS, R, MS Excel, MS Word
- Расширить навыки визуализации результатов статистического анализа
- Освоение методов анализа наступления биографических событий жизни
Планируемые результаты обучения
- Способен(а) строить таблицы сопряженности, содержащие различные виды относительных частот
- Способен(а) выбрать подходящий метод поиска связи между двумя признаками в зависимости от типа шкал
- Понимает разницу между типами связи и характеристиками связи, которые можно установить с помощью критерия "хи-квадрат" и коэффициентов ранговой корреляции
- Понимает разницу между условиями применения методов параметрической и непараметрической статистики;
- Умеет реализовать в пакете SPSS и интерпретировать результаты основных методов непараметрических сравнений (тесты Манна-Уитни и Вилкоксона, дисперсионный анализ Каскла-Уоллиса)
- Умеет рассчитывать в SPSS и интерпретировать значения критерия "хи-квадрат", коэффициентов ранговой корреляции Спирмена и Кендалла;
- Умеет выбирать регрессионную модель в зависимости от типа шкалы зависимой переменной;
- Знает особенности построения регрессионных моделей для категориальных переменных
- Может самостоятельно построить с помощью пакета SPSS, оценить качество и проинтерпретировать модель бинарной и мультиномиальной логистической регрессии с фиктивными переменными и без.
- Умеет прогнозировать (рассчитывать вероятность) наступление некоторого события на основе регрессионной модели
- Знает суть основных алгоритмов деревьев классификации: CHAID, CRT, QUEST
- Умеет строить модели деревьев классификации (CHAID, CRT,QUEST) с помощью пакета SPSS
- Умеет интерпретировать модели деревьев классификации и оценивать их качество
- Умеет устанавливать R и RStudio.
- Знает основные правила написания команд
- Умеет реализовать с помощью R простейшие методы анализа: частотные распределения, таблицы сопряженности, основные графики, коэффициенты парной связи.
- Умеет ориентироваться в многообразии методов анализа данных
- Понимает, чем отличается анализ агрегированных данных от индивидуальных данных (микроданных)
- Умеет выбрать подходящий метод анализа и знает при помощи каких статистических пакетов его осуществлять
- Владеет корпусом теоретических знаний о концепции жизненного пути
- Понимает разницу между терминами "время жизни", "жизненный цикл" и "жизненный путь"
- Знает основные термины концепции жизненного пути: событие, статусный переход, статусный пассаж, траектория, жизненный сценарий, биография
- Знает, какие методы входят в инструментарий концепции жизненного пути и для каких целей используется каждый из методов
- Умеет применять сетку Лексиса и пользоваться как ее аналитическим потенциалом, так и математической составляющей
- Умеет располагать события жизненного пути на сетку Лексиса
- Различает разницу между эффектами периода, возраста и когорты
- Умеет визуализировать события жизненного пути в разных программах: MS Word, MS Excel, IBM SPSS и др.
- Умеет осуществлять анализ наступления событий в IBM SPSS
- Умеет строить регрессии Кокса и делать оценки Каплана-Майера и интерпретировать полученные результаты
- Может проинтерпретировать регрессионные коэффициенты в моделях (регрессии Кокса) и сопоставить их с графиками выживаемости
- Умеет проводить анализ наступления событий как через интерфейс IBM SPSS, так и посредством синтаксиса
- Понимает отличие анализа последовательностей наступления событий от анализа наступления событий
- Умеет интерпретировать хронограммы, являющиеся способом визуализации последовательностей наступления событий
- Понимает разницу между способом отображения данных "Person-Level Data" и "Person-Period Data"
Содержание учебной дисциплины
- Тема № 1. Анализ двумерной связи между номинальными и порядковыми переменными. Критерий «хи-квадрат», коэффициенты ранговой корреляцииТаблицы сопряженности. Возможное содержание ячеек таблицы. Условные и безусловные частоты. Коэффициенты парной связи для различных типов шкал. Критерий Хи-квадрат и основанные на нем коэффициенты. Коэффициенты ранговой корреляции Спирмена и Кендалла.
- Тема №2. Базовые методы непараметрических сравненийРазличия параметрической и непараметрической статистики. Достоинства и недостатки непараметрических методов, по сравнению с параметрическими. Непараметрические аналоги некоторых параметрических методов: одновыборочный тест знаков (непараметрический аналог одновыборочного Т-теста), тесты суммы рангов Манна –Уитни и Вилкоксона (непараметрические аналоги Т-теста для независимых выборок), тест приписанных знаков рангов Вилкоксона (непараметрический аналог Т-теста для связанных выборок) и непараметрический дисперсионный анализ Краскла-Уоллиса (непараметрический аналог однофакторного дисперсионного анализа)
- Тема №3. Логистическая регрессия (бинарная и мультиномиальная)Бинарная логистическая регрессия Регрессионные модели для бинарных зависимых переменных. Модель линейной вероятности. Логистическая регрессия. Интерпретация коэффициентов логистической регрессии. Шансы и отношения шансов. Мультиномиальная логистическая регрессия. Представление зависимой переменной в мультиномиальной логистической регрессии. Выбор контрольных групп. Интерпретация коэффициентов уравнения мультиномиальной логистической регрессии. Ограничения мультиномиальной логистической регрессии
- Тема №4. Модели деревьев классификации (деревьев решений).Модели деревьев решений. Особенности работы алгоритмов CHAID и CRT. Ошибки классификации, определение понятия риска. Проверка качества модели, способы решения проблемы излишней подгонки дерева: кросс-проверка, V-кратная кросс-проверка.
- Тема №5. Работа со статистическим пакетом RИнтерфейс пакета R и оболочки RStudio. Установка R и RStudio. Скачивание библиотек. Основные правила написания команд. Реализация в R основных методов анализа данных.
- Тема №6. Методы анализа биографических данных в общей структуре методовОбзор источников и видов данных (количественные и качественные; агрегированные и индивидуальные). Классификация методов анализа данных.
- Тема №7. Концепция жизненного пути и ее инструментарийКонцепция жизненного пути: истоки, развитие и перспективы применения. Базовые определения концепции: жизненный путь, статусный переход, статусный пассаж и другие. Структура методов анализа событий жизненного пути
- Тема №8. Способы визуализации событий жизни: сетка Лексиса и другие инструментыСетка Лексиса: ее аналитический и математический потенциал применения для анализа и визуализации наступления событий. APC-analysis: разделение эффектов периода, возраста и когорты. Способы визуализации наступления событий в разных компьютерных программах
- Тема №9. Анализ наступления событий (Event history analysis)Комплекс методов анализа наступления событий: таблицы смертности, метод Каплана-Майера, регрессия Кокса: теоретическая основа и практика в IBM SPSS
- Тема №10. Анализ последовательностей наступления событий (Sequence analysis)Различие подходов при анализе отдельных событий и последовательности событий. Разница между способом отображения данных "Person-Level Data" и "Person-Period Data". Визуализация последовательностей событий: хронограммы и другие инструменты.
Элементы контроля
- Домашнее задание "Деревья классификации"Вес в итоговой оценке-25%
- Домашнее задание "Выбор метода решения исследовательской задачи"Вес в итоговой оценке-25%
- Контрольная работа "Сетка Лексиса"Вес в итоговой оценке-25%
- Домашнее задание "Event history analysis"Вес в итоговой оценке-25%
Промежуточная аттестация
- Промежуточная аттестация (2 модуль)0.25 * Домашнее задание "Event history analysis" + 0.25 * Домашнее задание "Выбор метода решения исследовательской задачи" + 0.25 * Домашнее задание "Деревья классификации" + 0.25 * Контрольная работа "Сетка Лексиса"
Список литературы
Рекомендуемая основная литература
- SPSS 19: профессиональный статистический анализ данных, Наследов, А., 2011
- Анализ социологических данных : методология, дескриптивная статистика, изучение связей между номинальными признаками : учеб.пособие для вузов, Толстова, Ю. Н., 2000
- Анализ социологических данных с помощью пакета SPSS : учеб. пособие для вузов, Крыштановский, А. О., 2006
Рекомендуемая дополнительная литература
- Демография : учеб. пособие для вузов, Денисенко, М. Б., 2007
- Демография : учеб. пособие для вузов, Денисенко, М. Б., 2010
- Практическая бизнес - статистика, Сигел, Э. Ф., 2004