Анализ тональности текстов из социальных сетей на основе методов машинного обучения для мониторинга общественных настроенийSentiment analysis of texts from social networks based on machine learning methods for sentiment monitoring
Соискатель:
Сметанин Сергей Игоревич
Руководитель:
Члены комитета:
Деркач Денис Александрович (НИУ ВШЭ, PhD, председатель комитета), Гош Арнаб (Snap Inc., PhD, член комитета), Ковтуненко Алексей Сергеевич (Уфимский государственный авиационный технический университет, к.т.н., член комитета), Маколкина Мария Александровна (Санкт-Петербургский государственный университет телекоммуникаций им. проф. М.А. Бонч-Бруевича, д.т.н., член комитета), Цуканова Ольга Александровна (Российский экономический университет имени Г.В. Плеханова, к.т.н., член комитета)
Диссертация принята к предварительному рассмотрению:
10/12/2022
Диссертация принята к защите:
10/26/2022
Дисс. совет:
Совет по компьютерным наукам
Дата защиты:
12/15/2022
Данная работа посвящена разработка моделей, методов и программных комплексов, предназначенных для мониторинга общественных настроений путем анализа тональности текстовых постов из социальных сетей, написанных на русском языке. Предлагаемые модели и методы открывают путь к дальнейшему развитию мониторинга общественных настроений на основе контента из социальных сетей и позволяют заинтересованным сторонам измерять общественные настроения не только автоматически, но и за прошлые периоды времени. Для анализа настроений были выявлены наиболее эффективные подходы с точки зрения качества классификации русскоязычных текстов. Для решения проблемы отсутствия 100% точности классификационных алгоритмов была предложена новая модель и метод моделирования, позволяющий оценить влияние погрешности ошибочной классификации на вычисляемые индексы общественного настроения. Для расчета индексов настроений была предложена новая модель и метод расчета индекса настроений на основе цифровых следов, учитывающий демографические характеристики пользователей. Предложенные модели и методы были применены к данным социальной сети «Одноклассники» и был рассчитан индекс общественного настроения на основе текстовых постов. Полученный индекс продемонстрировал высокую корреляцию с традиционным опросным Индексом счастья ВЦИОМ.
Диссертация [*.pdf, 12.22 Мб] (дата размещения 10/14/2022)
Резюме [*.pdf, 4.11 Мб] (дата размещения 10/14/2022)
Summary [*.pdf, 4.02 Мб] (дата размещения 10/14/2022)
Публикации, в которых излагаются основные результаты диссертации
Smetanin S. Pulse of the Nation: Observable Subjective Well-Being in Russia Inferred from Social Network Odnoklassniki (смотреть на сайте журнала)
Smetanin S., Komarov M. Misclassification Bias in Computational Social Science: A Simulation Approach for Assessing the Impact of Classification Errors on Social Indicators Research (смотреть на сайте журнала)
Smetanin S., Komarov M. Deep transfer learning baselines for sentiment analysis in Russian (смотреть на сайте журнала)
Smetanin S. The Applications of Sentiment Analysis for Russian Language Texts: Current Challenges and Future Perspectives (смотреть на сайте журнала)
Отзывы
Отзыв научного руководителя
- Комаров Михаил Михайлович (дата размещения 10/14/2022)
Сведения о результатах защиты:
Комитет по диссертации рекомендовал присудить ученую степень кандидата наук (протокол № 2 от 15.12.2022). Решением диссертационного совета (протокол № 1 от 20.01.2023) присуждена ученая степень кандидата компьютерных наук.
См. на ту же тему
Моделирование репродуктивного поведения россиян в периоды шоков 2000-2023 годовКандидатская диссертация
Соискатель: Горский Дмитрий Ильич
Руководитель: Вакуленко Елена Сергеевна
Разработка алгоритмов построения пайплайнов машинного обучения методами обработки естественного языка основанными на данныхКандидатская диссертация
Соискатель: Трофимова Екатерина Алексеевна
Руководитель: Устюжанин Андрей Евгеньевич
Приложение машинного обучения к теоретико-игровым задачам: аукционы и марковские игрыКандидатская диссертация
Соискатель: Иванов Дмитрий Игоревич
Руководитель: Нестеров Александр Сергеевич
Дата защиты: 12/27/2024