Энтропийные тематические модели и методы их агрегированияEntropic topic models and methods of their aggregation
Соискатель:
Члены комитета:
Громов Василий Александрович (НИУ ВШЭ, д.ф.-м.н., председатель комитета), Васильев Александр Николаевич (Санкт-Петербургский политехнический университет Петра Великого, д.т.н., член комитета), Лепский Александр Евгеньевич (НИУ ВШЭ, д.ф.-м.н., член комитета), Новиков Борис Асенович (НИУ ВШЭ в Санкт-Петербурге, д.ф.-м.н., член комитета), Чхартишивили Александр Гедеванович (Институт проблем управления им. В.А. Трапезникова Российской академии наук, д.ф.-м.н., член комитета)
Диссертация принята к предварительному рассмотрению:
10/26/2022
Диссертация принята к защите:
12/12/2022
Дисс. совет:
Совет по компьютерным наукам
Дата защиты:
2/1/2023
В работе рассмотрены возможности применения деформированных энтропий (энтропия Реньи, Цаллиса, Шарма-Миттала) для анализа поведения тематических моделей как функции от гиперпараметров. В рамках данной работы коллекция документов и слов рассматривается в виде мезоскопической информационной системы, состояние которой описывается деформированными энтропиями, а поведение информационной системы определяется значениями гиперпараметров и числом кластеров/тем. Тематическое моделирование рассматривается как процедура упорядочивания информационный системы. Исходя из этого, проблема выбора оптимальных значений параметров тематических моделей сводится к задаче нахождения минимума свободной энергии или минимума параметризованной энтропии.
Диссертация [*.pdf, 75.21 Мб] (дата размещения 11/11/2022)
Резюме [*.pdf, 3.01 Мб] (дата размещения 11/11/2022)
Summary [*.pdf, 2.92 Мб] (дата размещения 11/11/2022)
Публикации, в которых излагаются основные результаты диссертации
Koltcov S., Koltsova O., Nikolenko S. Latent dirichlet allocation: Stability and applications to studies of user-generated content (смотреть на сайте журнала)
Koltcov S., Ignatenko V., Terpilovskii M., Rosso P. Analysis and tuning of hierarchical topic models based on Renyi entropy approach (смотреть на сайте журнала)
Koltcov S., Ignatenko V., Pashakhin S. How Many Clusters? An Entropic Approach to Hierarchical Cluster Analysis (смотреть на сайте журнала)
Koltcov S., Ignatenko V. Renormalization Approach to the Task of Determining the Number of Topics in Topic Modeling (смотреть на сайте журнала)
Koltcov S., Ignatenko V., Boukhers Z., Staab S. Analyzing the influence of hyper-parameters and regularizers of topic modeling in terms of Renyi entropy (смотреть на сайте журнала)
Koltcov S., Ignatenko V., Koltsova O. Estimating topic modeling performance with Sharma-Mittal entropy (смотреть на сайте журнала)
Ignatenko V., Koltcov S., Staab S., Boukhers Z. Fractal approach for determining the optimal number of topics in the field of topic modeling (смотреть на сайте журнала)
Mavrin A., Filchenkov A., Koltcov S. Four keys to topic interpretability in topic modeling (смотреть на сайте журнала)
Koltsov S., Pashakhin S., Dokuka S. A full-cycle methodology for news topic modeling and user feedback research (смотреть на сайте журнала)
Koltcov S. Application of Rényi and Tsallis entropies to topic modeling optimization (смотреть на сайте журнала)
Koltcov S.N. A thermodynamic approach to selecting a number of clusters based on topic modeling (смотреть на сайте журнала)
Koltcov S., Nikolenko S.I., Koltsova O., Bodrunova S. Stable topic modeling for web science: Granulated LDA (смотреть на сайте журнала)
Nikolenko S.I., Koltcov S., Koltsova O. Topic modelling for qualitative studies (смотреть на сайте журнала)
Koltcov S.N., Nikolenko S.I., Koltsova E.Y. Gibbs sampler optimization for analysis of a granulated medium (смотреть на сайте журнала)
Koltsova O., Koltcov S. Mapping the public agenda with topic modeling: The case of the Russian LiveJournal (смотреть на сайте журнала)
Bodrunova S., Koltsov S., Koltsova O., Nikolenko S., Shimorina A. Interval semi-supervised LDA: Classifying needles in a haystack (смотреть на сайте журнала)
Сведения о результатах защиты:
Комитет по диссертации рекомендовал присудить ученую степень доктора компьютерных наук (протокол №2 от 01.02.2023). Решением диссертационного совета (протокол № 2 от 06.03.2023) присуждена ученая степень доктора компьютерных наук.
См. на ту же тему
Применение методов автоматической обработки языка для исследования освещения межэтнических отношений и других социально-проблемных тем в больших массивах пользовательских текстовДокторская диссертация
Соискатель: Кольцова Елена Юрьевна
Дата защиты: 4/23/2024