• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
2024/2025

Text Mining. Введение

Статус: Маго-лего
Когда читается: 3 модуль
Охват аудитории: для своего кампуса
Язык: русский
Кредиты: 3
Контактные часы: 40

Программа дисциплины

Аннотация

Text mining часто переводится на русский язык как интеллектуальный анализ текстов. Более точным представляется такой перевод: (полу)автоматизированная обработка и анализ больших текстовых данных. Эта учебная дисциплина нацелена на знакомство студентов с понятиями text mining, типами решаемых задач и подходами к их решению (i предобработка текстов естественного языка, ii выявление среди текстов наиболее наполненных и для них – наиболее высокочастотных слов, iii распределение текстов на релевантные и нерелевантные, iv тематическое моделирование, v сентимент-анализ, vi построение прогностических моделей на текстовых данных), а также на практическое освоение некоторых из этих подходов. Практическое освоение предполагает написание собственного программного кода на языке Python/или R и оперирование готовыми релевантными модулями и пакетами, доступными в этих программных средах. Освоив в таком ключе отдельные подходы и имея концептуальное представление об области text mining в целом, студенты без труда смогут экстраполировать свои навыки и на другие подходы.