Сравнительный анализ алгоритмов заполнения пропусков в социологических данных
Соискатель:
Руководитель:
Оппоненты:
Чеботарев Павел Юрьевич; Татарова Гульсина Галеевна
Специальность:
22.00.01 Теория, история и методология социологии
Дисс. совет:
Д 212.048.01 - Совет по социологическим наукам
Дата защиты:
5/18/2012
Работа, направлена на систематизацию методов заполнения пропусков в данных и выявление условий их эффективного использования в социологии. Актуальность работы определяется тем, что на сегодняшний день разработано множество алгоритмов заполнения пропусков, но сведения о них не систематизированы и разбросаны по большому количеству работ. Крайне малочисленны и исследования, направленные на сравнительную оценку применимости отдельных алгоритмов заполнения пропусков в конкретных исследовательских ситуациях.
В диссертации проанализирована связь между причинами возникновения пропусков в социологических данных и типами пропусков по степени случайности. Даны рекомендации по выявлению ситуаций, в которых недопустимо искусственное заполнение пропусков. Дано систематическое описание большинства известных алгоритмов заполнения пропусков в социологических данных. Разработана и апробирована методика экспериментальной оценки эффективности заполнения пропусков с помощью различных алгоритмов, в зависимости от доли пропусков в данных и метода последующего анализа данных (рассматривались методы анализа данных, чаще всего используемые в социологических исследованиях). Экспериментально установлено, что эффективность заполнения пропусков зависит в некоторых случаях (в частности, при построении регрессионных моделей с фиктивными переменными и расчете мер описательной статистики) не просто от метода анализа данных, но и от характера решаемой социологической задачи. Цель исследования — определить, в каких случаях допустимо искусственное заполнение пропусков в социологических данных, и экспериментально сравнить эффективность отдельных алгоритмов заполнения пропусков, в зависимости от характеристик исследовательской ситуации: количества (доли) имеющихся пропусков и используемого метода анализа данных. Объект исследования – алгоритмы заполнения пропусков в данных. Предмет исследования – эффективность отдельных алгоритмов заполнения пропусков при использовании различных методов многомерного анализа данных с учетом количества пропусков.
В диссертации проанализирована связь между причинами возникновения пропусков в социологических данных и типами пропусков по степени случайности. Даны рекомендации по выявлению ситуаций, в которых недопустимо искусственное заполнение пропусков. Дано систематическое описание большинства известных алгоритмов заполнения пропусков в социологических данных. Разработана и апробирована методика экспериментальной оценки эффективности заполнения пропусков с помощью различных алгоритмов, в зависимости от доли пропусков в данных и метода последующего анализа данных (рассматривались методы анализа данных, чаще всего используемые в социологических исследованиях). Экспериментально установлено, что эффективность заполнения пропусков зависит в некоторых случаях (в частности, при построении регрессионных моделей с фиктивными переменными и расчете мер описательной статистики) не просто от метода анализа данных, но и от характера решаемой социологической задачи. Цель исследования — определить, в каких случаях допустимо искусственное заполнение пропусков в социологических данных, и экспериментально сравнить эффективность отдельных алгоритмов заполнения пропусков, в зависимости от характеристик исследовательской ситуации: количества (доли) имеющихся пропусков и используемого метода анализа данных. Объект исследования – алгоритмы заполнения пропусков в данных. Предмет исследования – эффективность отдельных алгоритмов заполнения пропусков при использовании различных методов многомерного анализа данных с учетом количества пропусков.
Автореферат [*.pdf, 333.69 Кб]
Ключевые слова: