• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Бакалавриат 2021/2022

Анализ данных в социологии

Статус: Курс обязательный (Социология)
Направление: 39.03.01. Социология
Когда читается: 3-й курс, 3, 4 модуль
Формат изучения: без онлайн-курса
Охват аудитории: для своего кампуса
Преподаватели: Воронина Наталья Дмитриевна, Зангиева Ирина Казбековна, Кускова Валентина Викторовна, Мальцева Дарья Васильевна, Семенова Анна Михайловна, Сокол Анна Андреевна, Сулейманова Анна Наильевна, Хвацкий Григорий Сергеевич
Язык: русский
Кредиты: 4
Контактные часы: 64

Программа дисциплины

Аннотация

Целями освоения дисциплины «Анализ данных в социологии» являются изучение и практическое освоение теории вероятностей, математической статистики и базовых методов статистического анализа данных в социальных науках;Изучение и практическое освоение компьютерных программ, применяемых для статистического анализа данных, таких как SPSS и R; приобретение понимания специфики работы с количественными данными в социальных науках, понимания типов задач, которые могут быть решены с помощью статистических методов. В результате освоения дисциплины студент должен знать основные понятия теории вероятностей, математической статистики, методы статистического анализа данных в пределах программы курса; уметь ставить и понимать социологические задачи, которые могут быть решены с помощью статистического анализа данных, понимать специфику данных, используемых в статистическом анализе, а также владеть навыками самостоятельного статистического анализа данных на компьютере в программах SPSS и R. В дистанционном режиме используются Zoom во время стоящих в расписании занятий и ЛМС для сообщений и сдачи работ. Подробности можно узнать у преподавателя по корпоративной почте.
Цель освоения дисциплины

Цель освоения дисциплины

  • Изучение базовых методов статистического анализа данных в социальных науках
  • Изучение и практическое освоение базовых методов статистического анализа данных в социальных науках
  • Изучение и практическое освоение компьютерной программы, применяемой для статистического анализа данных: SPSS
  • Изучение и практическое освоение компьютерных программ, применяемых для статистического анализа данных: SPSS и R
  • Приобретение понимания специфики работы с количественными данными в социальных науках, понимания типов задач, которые могут быть решены с помощью статистических методов.
  • Формирование понимания специфики работы с количественными данными в социальных науках, понимания типов задач, которые могут быть решены с помощью различных статистических методов
Планируемые результаты обучения

Планируемые результаты обучения

  • Умеет проверять кластерную модель на устойчивость
  • Can build and interpret statistical models base on analysis of longitudinal Data
  • Владеет навыками реализации иерархического КА и КА методом К-средних в SPSS
  • Владеет навыками реализации ФА МГК в SPSS
  • Знает возможности и ограничения применения кластерного анализа
  • Знает возможности и ограничения применения факторного анализа методом главных компонент (МГК)
  • Знает для решения каких задач в модель линейной регрессии включаются эффекты взаимодействия
  • Знает какие переменные перед включением в модель линейной регрессии необходимо преобразовать в фиктивные.
  • Знает логику создания фиктивных переменных и умеет их создавать в SPSS
  • Знает различия в иерархическом алгоритма КА и КА методом К-средних
  • Знает специфику зависимой переменной в модели бинарной логистической регрессии
  • Знает специфику зависимой переменной в модели мультиномиальной логистической регрессии
  • Знает суть основных алгоритмов деревьев классификации: CHAID, CRT, QUEST
  • Знает требования к выборке для получения корректных результатов ФА МГК
  • Знает требования к данным для построения моделей линейной регрессии
  • Знает требования к уровню измерения наблюдаемых переменных для кластерного
  • Знает требования к уровню измерения наблюдаемых переменных для факторного анализа МГК
  • Может интерпретировать регрессионные коэффициенты и оценивать качество моделей линейной регрессией
  • Обосновывает и отбирает итоговое количество кластеров в модели
  • Обосновывает и отбирает итоговое количество факторов в модели
  • Определяет качество полученных кластеров (в методе К-Средних): контрастность, наполненность и компактность
  • Отличает вырожденное факторное решение от невырожденного
  • Понимает задачи, решаемые с помощью многомерного шкалирования.
  • Понимает разницу между условиями использования метрического и неметрического МШ
  • Понимает разницу между условиями применения методов параметрической и непараметрической статистики.
  • Понимает, в каких случаях вместо линейной или бинарной логистической, необходимо использовать мультиномиальную логистическую регрессию.
  • Понимает, в каких случаях вместо линейной регрессии необходимо использовать логистическую регерссию, в частности бинарную.
  • Умеет проводить диагностику моделей линейной регрессии на основные ограничения и устранять несоблюдение этих ограничений
  • Умеет интерпретировать дендрограмму
  • Умеет интерпретировать модели деревьев классификации и оценивать их качество
  • Умеет интерпретировать модель бинарной логистической регрессии в линейной и экспоненциальной форме
  • Умеет интерпретировать модель мультиномиальной логистической регрессии в линейной и экспоненциальной форме
  • Умеет интерпретировать полученные значения кластерных переменных
  • Умеет интерпретировать полученные значения факторных переменных
  • Умеет интерпретировать регрессионные коэффициенты в модели линейной регрессии с фиктивными переменными
  • Умеет интерпретировать регрессионные коэффициенты при переменных-эффектах взаимодействия
  • Умеет интерпретировать факторные нагрузки
  • Умеет оценивать качество моделей многомерного шкалирования
  • Умеет оценивать качество модели бинарной логистической регрессии
  • Умеет оценивать качество модели мультиномиальной логистической регрессии
  • Умеет правильно выбирать метод вращения факторных нагрузок в ФА МГК
  • Умеет правильно интерпретировать таблицу шагов аггломерации (в иерархическом кластерном анализу)
  • Умеет реализовывать с помощью SPSS тесты Манна –Уитни, знаков рангов Вилкоксона и непараметрический анализ Краскла-Уоллиса
  • Умеет содержательно интерпретировать результаты тестов Манна –Уитни, знаков рангов Вилкоксона и непараметрического анализа Краскла-Уоллиса
  • Умеет создавать в SPSS и включать в регрессионную модель эффекты взаимодействия категориальных переменных, категориальных и интервальных переменных.
  • Умеет строить в SPSS модели многомерного шкалирования различной спецификации и сравнивать их
  • Умеет строить модели деревьев классификации (CHAID, CRT,QUEST) с помощью пакета SPSS
  • Умеет строить модель бинарной логистической регрессии в SPSS
  • Умеет строить модель мультиномиальной логистической регрессии в SPSS
  • Формулирует содержательные задачи, для решения которых применим кластерный анализ
  • Формулирует содержательные задачи, для решения которых применим факторный анализ
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Базовые методы непараметрической статистики
  • Мультиномиальная логистическая регрессия
  • Классическая линейная регрессия: парная и множественная. Введение в МНК. Ограничения модели регрессии.
  • Зй курс. Модели многомерного шкалирования
  • Регрессия с фиктивными переменными
  • 3й курс. Модели деревьев классификации (деревьев решений).
  • Эффекты взаимодействия в регрессионных моделях.
  • Longitudinal Data
  • Бинарная логистическая регрессия
  • Тема 7 Факторный анализ
  • Тема 8 Кластерный анализ
Элементы контроля

Элементы контроля

  • неблокирующий Контрольная работа "Мультиномиальная логистическая регрессия"
  • неблокирующий Контрольная работа "Деревья классификации"
  • неблокирующий Контрольная работа "Многомерное шкалирование"
  • неблокирующий Итоговая контрольная работа за 4й модуль
  • неблокирующий Homeworks in 3 module
  • неблокирующий Quizzes in 3rd module
  • неблокирующий In-Class Labs in 3rd module
  • неблокирующий Final work for 3rd module
  • неблокирующий Контрольная работа "Мультиномиальная логистическая регрессия"
  • неблокирующий Контрольная работа "Деревья классификации"
  • неблокирующий Контрольная работа "Многомерное шкалирование"
  • неблокирующий Итоговая контрольная работа за 4й модуль
  • неблокирующий Homeworks in 3 module
  • неблокирующий Quizzes in 3rd module
  • неблокирующий In-Class Labs in 3rd module
  • неблокирующий Final work for 3rd module
  • неблокирующий Домашнее задание «Непараметрическая статистика"
    Возможна выборочная устная защита домашнего задания.
  • неблокирующий Домашнее задание «Классическая линейная регрессия"
    Возможна выборочная устная защита домашнего задания.
  • неблокирующий Домашнее задание «Регрессия с фиктивными переменными и эффекты взаимодействия»
    Возможна выборочная устная защита домашнего задания.
  • неблокирующий Домашнее задание "Бинарная и мультиномиальная логистическая регрессия»
    Возможна выборочная устная защита домашнего задания.
  • неблокирующий Экзамен
    Длительность экзамена 60 минут. Экзамен проводится на платформе LMS и параллельно в ZOOM. К экзамену (соответствующей конференции в ZOOM) необходимо подключиться за 5 минут до начала. В это же время нужно зайти в LMS, в раздел «Экзамен» дисциплины «Анализ данных в социологии». Компьютер студента должен удовлетворять требованиям: наличие рабочей камеры и микрофона, поддержка ZOOM. Для участия в экзамене студент обязан: зайти в ZOOM под своим именем и фамилией, включить камеру и микрофон. Во время экзамена студентам запрещено: пользоваться какими бы то ни было материалами, выключать камеру и микрофон. Калькулятор в процессе экзамена тоже не требуется. Во время экзамена студентам разрешено: (перечислить действия). Кратковременным нарушением связи во время экзамена считается менее 5 минут. Долговременным нарушением связи во время экзамена считается временной период более 5х минут. При долговременном нарушении связи студент не может продолжить участие в экзамене. Процедура пересдачи экзамена аналогично процедуре сдачи. Студенты будет предложен вариант экзаменационного теста, отличный от того, который студент писал первый раз.
  • неблокирующий Контрольная работа за 2й модуль
    По темам 1-2
  • неблокирующий Контрольная работа за 3й модуль
    По темам 3-4
  • неблокирующий Домашнее задание «Факторный и кластерный анализы»
  • неблокирующий Средняя оценка за тесты по отдельным темам
    Каждый тест состоит из 5 вопросов. Всего 8 тестов по следующим темам: "Основы непараметрической статистики", "Линейная регрессия", "Регрессия с фиктивными переменными", "Эффекты взаимодействия в регрессионных моделях", "Бинарная логистическая регрессия", "Мультиномиальная логистическая регрессия", "Факторный анализ", "Кластерный анализ".
Промежуточная аттестация

Промежуточная аттестация

  • 2020/2021 учебный год 4 модуль
    0.04 * Домашнее задание «Непараметрическая статистика" + 0.04 * Домашнее задание "Бинарная и мультиномиальная логистическая регрессия» + 0.1 * Контрольная работа за 2й модуль + 0.1 * Контрольная работа за 3й модуль + 0.2 * Средняя оценка за тесты по отдельным темам + 0.4 * Экзамен + 0.04 * Домашнее задание «Факторный и кластерный анализы» + 0.04 * Домашнее задание «Классическая линейная регрессия" + 0.04 * Домашнее задание «Регрессия с фиктивными переменными и эффекты взаимодействия»
  • 2021/2022 учебный год 4 модуль
    0.1 * Homeworks in 3 module + 0.2 * Итоговая контрольная работа за 4й модуль + 0.1 * Контрольная работа "Мультиномиальная логистическая регрессия" + 0.1 * In-Class Labs in 3rd module + 0.1 * Контрольная работа "Деревья классификации" + 0.05 * Quizzes in 3rd module + 0.1 * Контрольная работа "Многомерное шкалирование" + 0.25 * Final work for 3rd module
Список литературы

Список литературы

Рекомендуемая основная литература

  • Baltagi, B. H. (2015). The Oxford Handbook of Panel Data. New York, NY: Oxford University Press. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=864682
  • Elementary statistics : a step by step approach, Bluman, A. G., 1995
  • Meyers, L. S. (2013). Performing Data Analysis Using IBM SPSS. Hoboken: Wiley. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=610849
  • SPSS 19: профессиональный статистический анализ данных, Наследов, А., 2011
  • SPSS: искусство обработки информации : анализ стат. данных и восстановление скрытых закономерностей: пер. с нем., Бююль, А., 2002
  • SPSS: Статистический анализ в маркетинговых исследованиях, Таганов, Д., 2005
  • Анализ социологических данных : методология, дескриптивная статистика, изучение связей между номинальными признаками : учеб.пособие для вузов, Толстова, Ю. Н., 2000
  • Анализ социологических данных с помощью пакета SPSS : учеб. пособие для вузов, Крыштановский, А. О., 2006
  • Маркетинговые исследования с SPSS: Учебное пособие / Г. Моосмюллер, Н.Н. Ребик. - 2-e изд. - М.: ИНФРА-М, 2011. - 200 с.: 60x90 1/16. - (Высшее образование). (обложка) ISBN 978-5-16-004240-4 - Режим доступа: http://znanium.com/catalog/product/257371
  • Основы многомерного шкалирования : учеб. пособие для вузов, Толстова, Ю. Н., 2006

Рекомендуемая дополнительная литература

  • Син, Т. Занимательная статистика. Факторный анализ. Манга / Т. Син ; перевод с японского А. Б. Клионского. — Москва : ДМК Пресс, 2015. — 248 с. — ISBN 978-5-97060-116-7. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/93563 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
  • Устелемова, М. С. Шкалирование : учебное пособие / М. С. Устелемова. — 2-е изд. — Москва : ИНТУИТ, 2016. — 69 с. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/100491 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.

Авторы

  • Хвацкий Григорий Сергеевич
  • Кускова Валентина Викторовна
  • Зангиева Ирина Казбековна
  • Ротмистров Алексей Николаевич
  • Сулейманова Анна Наильевна
  • Воронина Наталья Дмитриевна