Бакалавриат
2020/2021
Анализ данных в социологии
Лучший по критерию «Новизна полученных знаний»
Статус:
Курс обязательный (Социология)
Направление:
39.03.01. Социология
Кто читает:
Департамент социологии
Где читается:
Факультет социальных наук
Когда читается:
3-й курс, 1, 2 модуль
Формат изучения:
без онлайн-курса
Преподаватели:
Воронина Наталья Дмитриевна,
Зангиева Ирина Казбековна,
Кускова Валентина Викторовна,
Сулейманова Анна Наильевна,
Хвацкий Григорий Сергеевич
Язык:
русский
Кредиты:
4
Контактные часы:
64
Программа дисциплины
Аннотация
Целями освоения дисциплины «Анализ данных в социологии» являются изучение и практическое освоение теории вероятностей, математической статистики и базовых методов статистического анализа данных в социальных науках;Изучение и практическое освоение компьютерных программ, применяемых для статистического анализа данных, таких как SPSS и STATA; приобретение понимания специфики работы с количественными данными в социальных науках, понимания типов задач, которые могут быть решены с помощью статистических методов. В результате освоения дисциплины студент должен знать основные понятия теории вероятностей, математической статистики, методы статистического анализа данных в пределах программы курса; уметь ставить и понимать социологические задачи, которые могут быть решены с помощью статистического анализа данных, понимать специфику данных, используемых в статистическом анализе, а также владеть навыками самостоятельного статистического анализа данных на компьютере в программах SPSS и STATA.
Цель освоения дисциплины
- Изучение базовых методов статистического анализа данных в социальных науках
- Изучение и практическое освоение компьютерных программ, применяемых для статистического анализа данных:SPSS и Stata
- Приобретение понимания специфики работы с количественными данными в социальных науках, понимания типов задач, которые могут быть решены с помощью статистических методов.
Планируемые результаты обучения
- Понимает, в каких случаях вместо линейной или бинарной логистической, необходимо использовать мультиномиальную логистическую регрессию.
- Знает специфику зависимой переменной в модели мультиномиальной логистической регрессии
- Умеет строить модель мультиномиальной логистической регрессии в SPSS
- Умеет интерпретировать модель мультиномиальной логистической регрессии в линейной и экспоненциальной форме
- Умеет оценивать качество модели мультиномиальной логистической регрессии
- Знает суть основных алгоритмов деревьев классификации: CHAID, CRT, QUEST
- Умеет строить модели деревьев классификации (CHAID, CRT,QUEST) с помощью пакета SPSS
- Умеет интерпретировать модели деревьев классификации и оценивать их качество
- Понимает задачи, решаемые с помощью многомерного шкалирования.
- Понимает разницу между условиями использования метрического и неметрического МШ
- Умеет строить в SPSS модели многомерного шкалирования различной спецификации и сравнивать их
- Умеет оценивать качество моделей многомерного шкалирования
- Can build and interpret statistical models base on analysis of longitudinal Data
Содержание учебной дисциплины
- Мультиномиальная логистическая регрессияПредставление зависимой переменной в мультиномиальной логистической регрессии. Выбор контрольных групп. Интерпретация коэффициентов уравнения мультиномиальной логистической регрессии. Ограничения мультиномиальной логистической регрессии.
- Тема 2. Модели многомерного шкалированияМногомерное шкалирование как метод анализа данных, его цели и задачи. Классификация методов многомерного шкалирования. Исходные данные для многомерного шкалирования. Понятие близости данных. Методы получения данных о близости. Меры близости. Матрицы сходства и расстояния в многомерном шкалировании. R и Q – модели в многомерном шкалировании. Представление и первичная обработка статистических данных в многомерном шкалировании. Подготовка данных к многомерному шкалированию: типы матриц (матрица условных вероятностей, или матрица идентификаций, матрицы перехода, матрица совместных вероятностей, матриц мер различия профилей). Метрическое многомерное шкалирование. Классическая модель многомерного шкалирования Торгерсона: алгоритм, теоретические постулаты. Обобщенный алгоритм метрического многомерного шкалирования. Понятие о неметрическом многомерном шкалировании, его особенности. Метрики расстояний. Модели НМШ. Алгоритм НМШ. Стресс-формулы.
- Тема 3. Модели деревьев классификации (деревьев решений).Модели деревьев решений. Особенности работы алгоритмов CHAID и CRT. Ошибки классификации, определение понятия риска. Проверка качества модели, способы решения проблемы излишней подгонки дерева: кросс-проверка, V-кратная кросс-проверка.
- Longitudinal DataThis part of course is about quantitative methods, namely statistics, applied to social sciences. Specifically, we will focus on certain statistical competencies that help evaluate processes over time. I expect you to understand the basics of statistics you’ve learned previously in this course; everything else we will learn in this class. As you will see, we will use a lot of real-world datasets, and I am concerned more with your understanding on how statistic works as opposed to memorizing the formulas. This class will be unique in a sense that I will bring a lot of non-statistical material to help you understand the world of decision sciences. Many students are afraid of statistics. Please don’t be. I promise you, you don’t have to have the brain of Einstein to master it. You do have to work hard and keep on top of the material, because it is cumulative. If you feel that you start falling behind, see me immediately – we’ll develop a strategy to help you catch up. At the conclusion of the course, students should be able to: 1. Understand the meaning and use of longitudinal models. 2. Present and/or interpret data in tables and charts. 3. Understand and apply descriptive statistical measures to real-life situations. 4. Understand and apply probability distributions to model different types of social processes. 5. Understand and apply statistical inference techniques (including statistical estimation and hypothesis testing) in longitudinal settings. 6. Understand and apply different types of longitudinal models to data; select an appropriate model based on the type of data. 7. Be able to forecast future numbers based on historical data. 8. Use computer software to perform statistical analysis on data (specifically, STATA). 9. Define and resolve problems, and recognize the most common decision errors and make tough decisions in a competent way. 10. Work within a team to analyze real-life problem(s) and make substantive recommendations for improvement.
Элементы контроля
- Контрольная работа "Мультиномиальная логистическая регрессия"
- Контрольная работа "Деревья классификации"
- Контрольная работа "Многомерное шкалирование"
- Итоговая контрольная работа за 1й модуль
- Homeworks in 2 module
- Quizzes in 2rd module
- In-Class Labs in 2rd module
- Final work for 2rd module
Промежуточная аттестация
- Промежуточная аттестация (2 модуль)0.25 * Final work for 2rd module + 0.1 * Homeworks in 2 module + 0.1 * In-Class Labs in 2rd module + 0.05 * Quizzes in 2rd module + 0.2 * Итоговая контрольная работа за 1й модуль + 0.1 * Контрольная работа "Деревья классификации" + 0.1 * Контрольная работа "Многомерное шкалирование" + 0.1 * Контрольная работа "Мультиномиальная логистическая регрессия"
Список литературы
Рекомендуемая основная литература
- Baltagi, B. H. (2015). The Oxford Handbook of Panel Data. New York, NY: Oxford University Press. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=864682
- SPSS 19: профессиональный статистический анализ данных, Наследов, А., 2011
- Анализ социологических данных : методология, дескриптивная статистика, изучение связей между номинальными признаками : учеб.пособие для вузов, Толстова, Ю. Н., 2000
- Основы многомерного шкалирования : учеб. пособие для вузов, Толстова, Ю. Н., 2006
Рекомендуемая дополнительная литература
- Устелемова М.С. - Шкалирование - Национальный Открытый Университет "ИНТУИТ" - 2016 - 69с. - ISBN: - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/100491