Бакалавриат
2020/2021
Статистический анализ данных (SPSS)
Статус:
Курс по выбору (Маркетинг и рыночная аналитика)
Направление:
38.03.02. Менеджмент
Кто читает:
Департамент социологии
Где читается:
Высшая школа бизнеса
Когда читается:
3-й курс, 3 модуль
Формат изучения:
без онлайн-курса
Охват аудитории:
для своего кампуса
Язык:
русский
Кредиты:
3
Контактные часы:
30
Программа дисциплины
Аннотация
Целями освоения дисциплины «Анализ данных в социологии» являются изучение и практическое освоение теории вероятностей, математической статистики и базовых методов статистического анализа данных в маркетинге и рыночной аналитике; изучение и практическое освоение компьютерных программ, применяемых для статистического анализа данных (пакета SPSS); приобретение понимания специфики работы с количественными данными в маркетинговых исследованиях, понимания типов задач, которые могут быть решены с помощью статистических методов. В результате освоения дисциплины студент должен знать основные понятия теории вероятностей, математической статистики, методы статистического анализа данных в пределах программы курса; уметь ставить и понимать задачи в области маркетинговых исследований, которые могут быть решены с помощью статистического анализа данных, понимать специфику данных, используемых в статистическом анализе, а также владеть навыками самостоятельного статистического анализа данных на компьютере в программах SPSS.
Цель освоения дисциплины
- Изучение и практическое освоение базовых методов статистического анализа данных в маркетинге и рыночной аналитике
- Изучение и практическое освоение компьютерных программ, применяемых для статистического анализа данных (SPSS)
- Приобретение понимания специфики работы с количественными данными в маркетинговых исследованиях, понимания типов задач, которые могут быть решены с помощью статистических методов
Планируемые результаты обучения
- Формулирует содержательные задачи, для решения которых применим факторный анализ
- Знает возможности и ограничения применения факторного анализа методом главных компонент (МГК)
- Знает требования к уровню измерения наблюдаемых переменных для факторного анализа МГК
- Знает требования к выборке для получения корректных результатов ФА МГК
- Владеет навыками реализации ФА МГК в SPSS
- Умеет правильно выбирать метод вращения факторных нагрузок в ФА МГК
- Умеет интерпретировать полученные значения факторных переменных
- Умеет интерпретировать факторные нагрузки
- Отличает вырожденное факторное решение от невырожденного
- Обосновывает и отбирает итоговое количество факторов в модели
- Формулирует содержательные задачи, для решения которых применим кластерный анализ
- Знает возможности и ограничения применения кластерного анализа
- Знает требования к уровню измерения наблюдаемых переменных для кластерного
- Знает различия в иерархическом алгоритма КА и КА методом К-средних
- Владеет навыками реализации иерархического КА и КА методом К-средних в SPSS
- Умеет правильно интерпретировать таблицу шагов аггломерации (в иерархическом кластерном анализу)
- Умеет интерпретировать полученные значения кластерных переменных
- Умеет интерпретировать дендрограмму
- Определяет качество полученных кластеров (в методе К-Средних): контрастность, наполненность и компактность
- Обосновывает и отбирает итоговое количество кластеров в модели
- Умеет проверять кластерную модель на устойчивость
- Формулирует содержательные задачи, для решения которых применим дискриминантный анализ
- Знает возможности и ограничения применения дискриминантного анализа
- Знает требования к уровню измерения переменной образующей кластер и параметров классификации для дискриминантного анализа
- Владеет навыками реализации дискриминантного анализа в SPSS
- Понимает смысл дискриминирующей функции, и интерпретирует значения ее коэффициентов.
- Знает смысл коэффициента канонической корреляции. Интерпретирует коэффициент Лямбда Уилкса и значения центроидов.
- Знает требования к данным для построения моделей линейной регрессии
- Умеет проводить диагностику моделей линейной регрессии на основные ограничения и устранять несоблюдение этих ограничений
- Может интерпретировать регрессионные коэффициенты и оценивать качество моделей линейной регрессией
- Знает какие переменные перед включением в модель линейной регрессии необходимо преобразовать в фиктивные.
- Знает логику создания фиктивных переменных и умеет их создавать в SPSS
- Умеет интерпретировать регрессионные коэффициенты в модели линейной регрессии с фиктивными переменными
- Понимает, в каких случаях вместо линейной регрессии необходимо использовать логистическую регерссию, в частности бинарную.
- Знает специфику зависимой переменной в модели бинарной логистической регрессии
- Умеет строить модель бинарной логистической регрессии в SPSS
- Умеет интерпретировать модель бинарной логистической регрессии в линейной и экспоненциальной форме
- Умеет оценивать качество модели бинарной логистической регрессии
Содержание учебной дисциплины
- Тема 1. Классическая линейная регрессия: парная и множественная. Введение в МНК. Ограничения модели регрессии.Парная линейная регрессия. Связь между корреляцией и регрессией. Оценка регрессионных коэффициентов методом наименьших квадратов. Интерпретация регрессионных коэффициентов и стандартных ошибок. Статистическая значимость коэффициентов. Регрессия с несколькими предикторами. Понятие статистического контроля. Интерпретация коэффициентов в множественной регрессии. Коэффициент детерминации R2. Допущения регрессионных моделей и диагностика моделей. Гетероскедастичность. Нелинейные связи. Статистические выбросы. Мультиколлинеарность. Принципы построения регрессионных моделей.
- Тема 2. Регрессия с фиктивными переменнымиРегрессия с категориальными независимыми переменными. Понятие фиктивных переменных. Интерпретация коэффициентов в регрессии с фиктивными переменными.
- Тема 3. Бинарная логистическая регрессияРегрессионные модели для бинарных зависимых переменных. Модель линейной вероятности. Логистическая регрессия. Интерпретация коэффициентов логистической регрессии. Шансы и отношения шансов.
- Тема 4. Дискриминантный анализСодержательные задачи, решаемые с помощью дискриминантного анализа. Специфика алгоритма, требования к уровню измерения переменных Дискриминирующая функция, интерпретация коэффициентов. Каноническая корреляция. Коэффициент Лямбда Уилкса. Центроиды. Проверка качества модели: кросс-проверка, V-кратная кросс-проверка.
- Тема 5. Факторный анализМодель факторного анализа (ФА) как модель латентных переменных. Различные подходы к определению числа факторов. Процент объясненной дисперсии как показатель качества факторной модели. Индивидуальные значения факторов. Сохранение факторов как новых переменных. Вращение матрицы факторных нагрузок. Ортогональные и неортогональные методы вращения.
- Тема 6. Кластерный анализИерархический агломеративный кластерный анализ. Кластерный анализ методом k-средних. Проблемы выбора меры расстояния и формы кластера. Проблема устойчивости кластеризации. Методы оценки устойчивости. Проблема отбора итогового количества кластеров в модели. Описание и интерпретация результатов кластеризации.
Элементы контроля
- Контрольная работа "Регрессионный анализ"
- Домашнее задание "Факторный и кластерный анализ"
- Экзамен
- Контрольная работа "Регрессионный анализ"
- Домашнее задание "Факторный и кластерный анализ"
- Экзамен
Промежуточная аттестация
- Промежуточная аттестация (3 модуль)0.25 * Домашнее задание "Факторный и кластерный анализ" + 0.25 * Контрольная работа "Регрессионный анализ" + 0.5 * Экзамен
Список литературы
Рекомендуемая основная литература
- SPSS: искусство обработки информации : анализ стат. данных и восстановление скрытых закономерностей: пер. с нем., Бююль, А., 2002
- Анализ социологических данных с помощью пакета SPSS : учеб. пособие для вузов, Крыштановский, А. О., 2006
Рекомендуемая дополнительная литература
- SPSS 19: профессиональный статистический анализ данных, Наследов, А., 2011
- SPSS: Статистический анализ в маркетинговых исследованиях, Таганов, Д., 2005
- Маркетинговые исследования : практ. руководство, Малхотра, Н. К., 2003