Магистратура
2020/2021
Анализ данных в образовании
Статус:
Курс обязательный (Доказательное развитие образования)
Направление:
38.04.04. Государственное и муниципальное управление
Кто читает:
Институт образования
Где читается:
Институт образования
Когда читается:
1-й курс, 1-3 модуль
Формат изучения:
без онлайн-курса
Прогр. обучения:
Доказательное развитие образования
Язык:
русский
Кредиты:
6
Контактные часы:
90
Программа дисциплины
Аннотация
Центральная задача курса — изучить и освоить базовые знания теории вероятности, математической статистики и количественных методов анализа данных. Главной особенностью курса является то, что его материал излагается на примерах, связанных с областью образования: слушатели знакомятся с результатами современных исследований в этой области и тренируются на данных исследований и мониторингов качества образования. Прохождение курса подразумевает самостоятельную внеаудиторную работу и освоение предложенных онлайн курсов. Большинство аудиторной работы будет посвящено дискуссиям и групповой работе.
Цель освоения дисциплины
- Знать возможности и ограничения изучаемых методов анализа
- Научиться подбирать методы количественного анализа данных под исследовательские вопросы, проводить анализ и интерпретировать его результаты
- Использовать R для статистического анализа данных
- Научиться содержательно и статистически описывать результаты анализа
Планируемые результаты обучения
- Интерпретирует результаты анализа, полученные с помощью различных методов, и оценивает их соответствие исследовательскому вопросу
- Подбирает и объясняет выбор методов под поставленные исследовательские вопросы с учетом возможностей и ограничений методов анализа
- Различает типы шкал переменных
- Описывает данные и переменные (уровни измерения, соответствующие типу шкалы описательные статистики)
- Реализовывает анализ с использованием изучаемых методов в R
- Представляет результаты своего анализа и других исследований, опубликованных в ведущих мировых журналах, в формах отчетов и презентаций
Содержание учебной дисциплины
- Базовые понятия теории вероятностей и комбинаторикиОсновы теории вероятности: элементы комбинаторики. Случайные события, классические определения вероятности. Операции с событиями: независимые события и условная вероятность. Правила сложения и умножения вероятностей.
- Базовые понятия статистики применительно к исследованиям в образованииВведение в статистику в социальных науках. Данные: переменные и наблюдения. Генеральная совокупность и выборка. Шкалы измерения. Описательная статистика: среднее, медиана, мода, меры разброса. Стандартная ошибка измерения. Доверительный интервал. Нормальное распределение. Стандартизация шкал. Графическое представление базовых статистик.
- Основы работы с RНачало работы в R, знакомство с интерфейсом. Ввод и импорт данных разных форматов (dat, sav, csv и другие). Работа с пакетами. Работа с переменными – кодирование, вычисление новых переменных, свойства переменных. Работа с данными – сортировка, отбор случаев, извлечение случайной выборки, агрегирование, чистка данных. Работа с файлами – слияние нескольких файлов.
- Сравнение средних, проверка гипотез и анализ дисперсииСтатистические гипотезы. Нулевая и альтернативные гипотезы. Ошибки первого и второго рода. Уровень значимости для различных распределений. Степени свободы и таблицы критических значений. Сравнение средних (t-тест и его непараметрические аналоги) и анализ дисперсии (ANOVA, MANOVA и их непараметрические аналоги).
- Связь между переменнымиМетоды определения связи между переменными, измеренными на разных шкалах. Линейная и нелинейная связь. Корреляция (Пирсона, Спирмена) и непараметрические методы. Хи-квадрат. Коэффициент детерминации (R2).
- Регрессионный анализЛинейный регрессионный анализ. Цели и методология. Статистические модели. Парная регрессия. Уравнение и характеристики модели. Интерсепт, регрессионные коэффициенты, ошибки. Множественный регрессионный анализ. Работа с дамми-переменными. Проверка допущений линейного регрессионного анализа. Процент объясненной дисперсии. Проверка качества моделей.
- Логистическая регрессияНелинейные регрессионные модели. Биноминальное распределение, распределение Бернулли. Бинарная, порядковая и мультиноминальная логистическая регрессия.
- Факторный анализЭксплораторный факторный анализ и метод главных компонент. Вращение: ортогональное и косоугольное. Факторные нагрузки.
- Кластерный анализОсновные цели, решаемые кластерным анализом, сфера применения. Иерархический кла- стерный анализ. Способы вычисления расстояний между объектами. Способы кластеризации. Неиерархический кластерный анализ, метод k-средних.
Элементы контроля
- Домашние работы
- Экзамен (проект)
- Контрольная работа-1Контрольная работа в конце второго модуля
- Контрольная работа-2Контрольная работа в третьем модуле
Промежуточная аттестация
- Промежуточная аттестация (3 модуль)0.5 * Домашние работы + 0.1 * Контрольная работа-1 + 0.1 * Контрольная работа-2 + 0.3 * Экзамен (проект)
Список литературы
Рекомендуемая основная литература
- Elementary statistics : a step by step approach, Bluman, A. G., 1995
- Statistical methods for the social sciences, Agresti, A., 2009
- Using multivariate statistics, Tabachnick, B. G., 2007
- Задачник по теории вероятностей для студентов социально - гуманитарных специальностей, Макаров, А. А., 2015
- Математические методы психологического исследования : анализ и интерпретация данных: учеб. пособие, Наследов, А. Д., 2006
- Статистический анализ и визуализация данных с помощью R, Мастицкий, С. Э., 2015
Рекомендуемая дополнительная литература
- Discovering statistics using R, Field, A., 2012