Магистратура
2024/2025![Цель освоения дисциплины](/f/src/global/i/edu/objectives.svg)
![Планируемые результаты обучения](/f/src/global/i/edu/results.svg)
![Содержание учебной дисциплины](/f/src/global/i/edu/sections.svg)
![Элементы контроля](/f/src/global/i/edu/controls.svg)
![Список литературы](/f/src/global/i/edu/library.svg)
Text Mining. Введение
Статус:
Курс обязательный (Социология публичной сферы и цифровая аналитика)
Направление:
39.04.01. Социология
Кто читает:
Департамент социологии
Где читается:
Факультет социальных наук
Когда читается:
1-й курс, 3 модуль
Формат изучения:
без онлайн-курса
Охват аудитории:
для своего кампуса
Преподаватели:
Якимова Ольга Александровна
Прогр. обучения:
Социология публичной сферы и цифровая аналитика
Язык:
русский
Кредиты:
3
Программа дисциплины
Аннотация
Text mining часто переводится на русский язык как интеллектуальный анализ текстов. Более точным представляется такой перевод: (полу)автоматизированная обработка и анализ больших текстовых данных. Эта учебная дисциплина нацелена на знакомство студентов с понятиями text mining, типами решаемых задач и подходами к их решению (i предобработка текстов естественного языка, ii выявление среди текстов наиболее наполненных и для них – наиболее высокочастотных слов, iii распределение текстов на релевантные и нерелевантные, iv тематическое моделирование, v сентимент-анализ, vi построение прогностических моделей на текстовых данных), а также на практическое освоение некоторых из этих подходов. Практическое освоение предполагает написание собственного программного кода на языке Python/или R и оперирование готовыми релевантными модулями и пакетами, доступными в этих программных средах. Освоив в таком ключе отдельные подходы и имея концептуальное представление об области text mining в целом, студенты без труда смогут экстраполировать свои навыки и на другие подходы.
Цель освоения дисциплины
- Знакомство с группой методов Text Mining и типами решаемых с их помощью задач
- Практическое освоение некоторых методов Text Mining (предобработка текста, базовый анализ) в рамках языков R или Python
Планируемые результаты обучения
- Получение концептуального представления о группе методов Text Mining (базовая предобработка текста, выделение выосокчастотных слов, тематический и сантимент-анализ)
- Получение представления о модулях и пакетах Python или R, с помощью которых реализуется автоматизированный анализ текста
Содержание учебной дисциплины
- Структура и содержание курса
- Понятие текста
- Как собрать материал для анализа?
- Дизайн исследования
- Лексические ресурсы
- Базовая обработка текста
- Продвинутая обработка текста
- Методы интеллектального анализа текста
Элементы контроля
- Разработка проектаПостановка проблемы, исследовательский вопрос, цель, задачи, объект, предмет, методология
- Activity
Список литературы
Рекомендуемая основная литература
- Попов, А. М. Анализ текста в пакете MATLAB : учебное пособие / А. М. Попов. — Санкт-Петербург : БГТУ "Военмех" им. Д.Ф. Устинова, 2018. — 66 с. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/122085 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
- Текст майнинг. Интеллектуальный анализ текста : дизайн исследований, сбор данных и методы анализа, Игнатов, Г., 2021
Рекомендуемая дополнительная литература
- Berry, M. W., & Kogan, J. (2010). Text Mining : Applications and Theory. Chichester, U.K.: Wiley. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=314553
- Text mining with R : a tidy approach, Silge, J., 2017