Бакалавриат
2023/2024
Анализ данных в социологии
Лучший по критерию «Новизна полученных знаний»
Статус:
Курс обязательный (Социология)
Направление:
39.03.01. Социология
Кто читает:
Департамент социологии
Где читается:
Факультет социальных наук
Когда читается:
3-й курс, 4 модуль
Формат изучения:
без онлайн-курса
Охват аудитории:
для своего кампуса
Язык:
русский
Кредиты:
3
Контактные часы:
34
Программа дисциплины
Аннотация
Целями освоения дисциплины «Анализ данных в социологии» являются изучение и практическое освоение теории вероятностей, математической статистики и базовых методов статистического анализа данных в социальных науках; изучение и практическое освоение компьютерных программ, применяемых для статистического анализа данных (пакета SPSS); приобретение понимания специфики работы с количественными данными в социальных науках, понимания типов задач, которые могут быть решены с помощью статистических методов. В результате освоения дисциплины студент должен знать основные понятия теории вероятностей, математической статистики, методы статистического анализа данных в пределах программы курса; уметь ставить и понимать социологические задачи, которые могут быть решены с помощью статистического анализа данных, понимать специфику данных, используемых в статистическом анализе, а также владеть навыками самостоятельного статистического анализа данных на компьютере в программах SPSS.
Цель освоения дисциплины
- Изучение и практическое освоение базовых методов статистического анализа данных в социальных науках
- Изучение и практическое освоение компьютерной программы, применяемой для статистического анализа данных: SPSS
- Формирование понимания специфики работы с количественными данными в социальных науках, понимания типов задач, которые могут быть решены с помощью различных статистических методов
Планируемые результаты обучения
- Умеет проверять кластерную модель на устойчивость
- Владеет навыками реализации иерархического КА и КА методом К-средних в SPSS
- Владеет навыками реализации ФА МГК в SPSS
- Знает возможности и ограничения применения кластерного анализа
- Знает возможности и ограничения применения факторного анализа методом главных компонент (МГК)
- Знает для решения каких задач в модель линейной регрессии включаются эффекты взаимодействия
- Знает какие переменные перед включением в модель линейной регрессии необходимо преобразовать в фиктивные.
- Знает логику создания фиктивных переменных и умеет их создавать в SPSS
- Знает различия в иерархическом алгоритма КА и КА методом К-средних
- Знает специфику зависимой переменной в модели бинарной логистической регрессии
- Знает требования к выборке для получения корректных результатов ФА МГК
- Знает требования к данным для построения моделей линейной регрессии
- Знает требования к уровню измерения наблюдаемых переменных для кластерного
- Знает требования к уровню измерения наблюдаемых переменных для факторного анализа МГК
- Может интерпретировать регрессионные коэффициенты и оценивать качество моделей линейной регрессией
- Обосновывает и отбирает итоговое количество кластеров в модели
- Обосновывает и отбирает итоговое количество факторов в модели
- Определяет качество полученных кластеров (в методе К-Средних): контрастность, наполненность и компактность
- Отличает вырожденное факторное решение от невырожденного
- Понимает разницу между условиями применения методов параметрической и непараметрической статистики.
- Понимает, в каких случаях вместо линейной регрессии необходимо использовать логистическую регерссию, в частности бинарную.
- Умеет проводить диагностику моделей линейной регрессии на основные ограничения и устранять несоблюдение этих ограничений
- Умеет интерпретировать дендрограмму
- Умеет интерпретировать модель бинарной логистической регрессии в линейной и экспоненциальной форме
- Умеет интерпретировать полученные значения кластерных переменных
- Умеет интерпретировать полученные значения факторных переменных
- Умеет интерпретировать регрессионные коэффициенты в модели линейной регрессии с фиктивными переменными
- Умеет интерпретировать регрессионные коэффициенты при переменных-эффектах взаимодействия
- Умеет интерпретировать факторные нагрузки
- Умеет оценивать качество модели бинарной логистической регрессии
- Умеет правильно выбирать метод вращения факторных нагрузок в ФА МГК
- Умеет правильно интерпретировать таблицу шагов аггломерации (в иерархическом кластерном анализу)
- Умеет реализовывать с помощью SPSS тесты Манна –Уитни, знаков рангов Вилкоксона и непараметрический анализ Краскла-Уоллиса
- Умеет содержательно интерпретировать результаты тестов Манна –Уитни, знаков рангов Вилкоксона и непараметрического анализа Краскла-Уоллиса
- Умеет создавать в SPSS и включать в регрессионную модель эффекты взаимодействия категориальных переменных, категориальных и интервальных переменных.
- Умеет строить модель бинарной логистической регрессии в SPSS
- Формулирует содержательные задачи, для решения которых применим кластерный анализ
- Формулирует содержательные задачи, для решения которых применим факторный анализ
Содержание учебной дисциплины
- Базовые методы непараметрической статистики
- Классическая линейная регрессия: парная и множественная. Введение в МНК. Ограничения модели регрессии.
- Регрессия с фиктивными переменными
- Эффекты взаимодействия в регрессионных моделях.
- Бинарная логистическая регрессия
- Мультиномиальная логистическая регрессия
- Тема 7 Факторный анализ
- Тема 8 Кластерный анализ
- Зй курс. Модели многомерного шкалирования
- 3й курс. Модели деревьев классификации (деревьев решений).
- Тема 9. Дискриминантный анализ
Элементы контроля
- Экзамен 1Темы 1 - 2
- Экзамен 2Темы 3-8
- №1. Непараметрическая статистика
- №2. Линейная регрессия
- №3. Регрессия с фиктивными переменными
- №4 Логистическая регрессия
- №5. Факторный анализ
- №6. Кластерный анализ
- Деревья классификации
- Многомерное шкалирование
- Дискриминантный анализ
- Итоговая контрольная работа за 4й модуль
Промежуточная аттестация
- 2022/2023 учебный год 2 модуль0.5 * Экзамен 1 + 0.25 * №1. Непараметрическая статистика + 0.25 * №2. Линейная регрессия
- 2022/2023 учебный год 4 модуль0.4 * Экзамен 2 + 0.15 * №3. Регрессия с фиктивными переменными + 0.15 * №4 Логистическая регрессия + 0.15 * №5. Факторный анализ + 0.15 * №6. Кластерный анализ
- 2023/2024 учебный год 4 модуль0.2 * Деревья классификации + 0.2 * Дискриминантный анализ + 0.4 * Итоговая контрольная работа за 4й модуль + 0.2 * Многомерное шкалирование
Список литературы
Рекомендуемая основная литература
- Elementary statistics : a step by step approach, Bluman, A. G., 1995
- Meyers, L. S. (2013). Performing Data Analysis Using IBM SPSS. Hoboken: Wiley. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=610849
- SPSS 19: профессиональный статистический анализ данных, Наследов, А., 2011
- SPSS: искусство обработки информации : анализ стат. данных и восстановление скрытых закономерностей: пер. с нем., Бююль, А., 2002
- SPSS: Статистический анализ в маркетинговых исследованиях, Таганов, Д., 2005
- Анализ социологических данных с помощью пакета SPSS : учеб. пособие для вузов, Крыштановский, А. О., 2006
- Маркетинговые исследования с SPSS: Учебное пособие / Г. Моосмюллер, Н.Н. Ребик. - 2-e изд. - М.: ИНФРА-М, 2011. - 200 с.: 60x90 1/16. - (Высшее образование). (обложка) ISBN 978-5-16-004240-4 - Режим доступа: http://znanium.com/catalog/product/257371
Рекомендуемая дополнительная литература
- Син, Т. Занимательная статистика. Факторный анализ. Манга / Т. Син , перевод с японского А. Б. Клионского. — Москва : ДМК Пресс, 2015. — 248 с. — ISBN 978-5-97060-116-7. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/93563 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.