Магистратура
2021/2022
Введение в интеллектуальный анализ данных
Статус:
Курс обязательный (Прикладные методы социального анализа рынков)
Направление:
39.04.01. Социология
Кто читает:
Департамент социологии
Где читается:
Факультет социальных наук
Когда читается:
1-й курс, 3, 4 модуль
Формат изучения:
с онлайн-курсом
Онлайн-часы:
41
Охват аудитории:
для своего кампуса
Преподаватели:
Ульянов Владимир Васильевич
Прогр. обучения:
Прикладные методы социального анализа рынков
Язык:
русский
Кредиты:
5
Контактные часы:
60
Программа дисциплины
Аннотация
Целями освоения дисциплины «Введение в интеллектуальный анализ данных» являются: знакомство с основными методами современного анализа данных; понимание того, в каких условиях, для решения каких задач и при каких ограничениях указанные методы применяются; умение применять пакет Rattle из свободной (бесплатной) программной среды вычислений R для анализа реальных социологических данных
Цель освоения дисциплины
- Знакомство с основными методами современного анализа данных
- Формирование понимания того, в каких условиях, для решения каких задач и при каких ограничениях указанные методы применяются.
- Формирование навыков работы с пакетом Rattle из свободной (бесплатной) программной среды вычислений R для анализа реальных социологических данных
Планируемые результаты обучения
- Владеет навыками анализа реальных социологических данных с применением пакета Rattle из программной среды вычислений R.
- Знает основные методы современного анализа данных для решения задач классификации, кластеризации, прогноза и скоринга.
- Умеет строить модели, оценивать их качество и сравнивать различные модели.
Содержание учебной дисциплины
- Обзор основных задач, методов и областей применения. Краткая история возникновения Data Mining
- Введение в язык программирования R и пакет RATTLE
- Деревья решений. Задачи классификации, прогнозирования и скоринга
- Построение деревьев решений с помощью пакетов языка программирования R
- Искусственные нейронные сети. Задачи классификации, прогнозирования и кластеризации.
- Построение искусственных нейронных сетей с помощью пакетов языка программирования R
- Генетические (эволюционные) алгоритмы. Задачи оптимизации и обучения нейронных сетей.
- Функции интенсивности отказа и анализ выживаемости в маркетинге.
- Анализ связей
Элементы контроля
- Работа на семинарах
- Эссе
- Итоговые модели
- Доклад по эссе
- Работа на семинарах
- Эссе
- Итоговые модели
- Доклад по эссе
Промежуточная аттестация
- 2021/2022 учебный год 4 модуль0.25 * Итоговые модели + 0.25 * Работа на семинарах + 0.25 * Эссе + 0.25 * Доклад по эссе
Список литературы
Рекомендуемая основная литература
- Hall, M., Witten, Ian H., Frank, E. Data Mining: practical machine learning tools and techniques. – 2011. – 664 pp.
- Han, J., Kamber, M., Pei, J. Data Mining: Concepts and Techniques, Third Edition. – Morgan Kaufmann Publishers, 2011. – 740 pp.
- James, G. et al. An introduction to statistical learning. – Springer, 2013. – 426 pp.
- Чубукова, И. А. Data Mining : учебное пособие / И. А. Чубукова. — 2-е изд. — Москва : ИНТУИТ, 2016. — 470 с. — ISBN 978-5-94774-819-2. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/100582 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
Рекомендуемая дополнительная литература
- Kantardzic, M., & Recorded Books, I. (2019). Data Mining : Concepts, Models, Methods, and Algorithms (Vol. Third edition). [Place of publication not identified]: Wiley-IEEE Press. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=2282578