• A
  • A
  • A
  • ABC
  • ABC
  • ABC
  • А
  • А
  • А
  • А
  • А
Regular version of the site

Introduction to Data Mining

2024/2025
Academic Year
RUS
Instruction in Russian
6
ECTS credits
Delivered at:
School of Sociology
Course type:
Elective course
When:
1 year, 3, 4 module

Instructor

Программа дисциплины

Аннотация

Целями освоения дисциплины «Введение в интеллектуальный анализ данных» являются: знакомство с основными методами современного анализа данных; понимание того, в каких условиях, для решения каких задач и при каких ограничениях указанные методы применяются; умение применять RStudio для анализа реальных социологических данных
Цель освоения дисциплины

Цель освоения дисциплины

  • Знакомство с основными методами современного анализа данных
  • Формирование понимания того, в каких условиях, для решения каких задач и при каких ограничениях указанные методы применяются.
  • Формирование навыков работы с RStudio для анализа реальных социологических данных
Планируемые результаты обучения

Планируемые результаты обучения

  • Владеет навыками анализа реальных социологических данных с применением пакета Rattle из программной среды вычислений R.
  • Знает основные методы современного анализа данных для решения задач классификации, кластеризации, прогноза и скоринга.
  • Умеет строить модели, оценивать их качество и сравнивать различные модели.
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Обзор основных задач, методов и областей применения. Краткая история возникновения Data Mining
  • Введение в язык программирования R и работу в RStudio
  • Деревья решений. Задачи классификации, прогнозирования и скоринга
  • Построение деревьев решений с помощью пакетов языка программирования R
  • Искусственные нейронные сети. Задачи классификации, прогнозирования и кластеризации.
  • Построение искусственных нейронных сетей с помощью пакетов языка программирования R
  • Генетические (эволюционные) алгоритмы. Задачи оптимизации и обучения нейронных сетей.
  • Функции интенсивности отказа и анализ выживаемости в маркетинге.
  • Анализ связей
Элементы контроля

Элементы контроля

  • неблокирующий Доклад по эссе
  • неблокирующий Работа на семинарах
  • неблокирующий Эссе
  • неблокирующий Итоговые модели
Промежуточная аттестация

Промежуточная аттестация

  • 2024/2025 4th module
    0.25 * Доклад по эссе + 0.25 * Итоговые модели + 0.25 * Работа на семинарах + 0.25 * Эссе
Список литературы

Список литературы

Рекомендуемая основная литература

  • Hall, M., Witten, Ian H., Frank, E. Data Mining: practical machine learning tools and techniques. – 2011. – 664 pp.
  • Han, J., Kamber, M., Pei, J. Data Mining: Concepts and Techniques, Third Edition. – Morgan Kaufmann Publishers, 2011. – 740 pp.
  • James, G. et al. An introduction to statistical learning. – Springer, 2013. – 426 pp.
  • Чубукова, И. А. Data Mining : учебное пособие / И. А. Чубукова. — 2-е изд. — Москва : ИНТУИТ, 2016. — 470 с. — ISBN 978-5-94774-819-2. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/100582 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.

Рекомендуемая дополнительная литература

  • Kantardzic, M., & Recorded Books, I. (2019). Data Mining : Concepts, Models, Methods, and Algorithms (Vol. Third edition). [Place of publication not identified]: Wiley-IEEE Press. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=2282578

Авторы

  • Ульянов Владимир Васильевич
  • Десятова Мария Ивановна