Мы используем файлы cookies для улучшения работы сайта НИУ ВШЭ и большего удобства его использования. Более подробную информацию об использовании файлов cookies можно найти здесь, наши правила обработки персональных данных – здесь. Продолжая пользоваться сайтом, вы подтверждаете, что были проинформированы об использовании файлов cookies сайтом НИУ ВШЭ и согласны с нашими правилами обработки персональных данных. Вы можете отключить файлы cookies в настройках Вашего браузера.

  • A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Энтропийные тематические модели и методы их агрегированияEntropic topic models and methods of their aggregation

Члены комитета:
Громов Василий Александрович (НИУ ВШЭ, д.ф.-м.н., председатель комитета), Васильев Александр Николаевич (Санкт-Петербургский политехнический университет Петра Великого, д.т.н., член комитета), Лепский Александр Евгеньевич (НИУ ВШЭ, д.ф.-м.н., член комитета), Новиков Борис Асенович (НИУ ВШЭ в Санкт-Петербурге, д.ф.-м.н., член комитета), Чхартишивили Александр Гедеванович (Институт проблем управления им. В.А. Трапезникова Российской академии наук, д.ф.-м.н., член комитета)
Диссертация принята к предварительному рассмотрению:
26.10.2022
Диссертация принята к защите:
12.12.2022
Дисс. совет:
Совет по компьютерным наукам
Дата защиты:
1.02.2023
В работе рассмотрены возможности применения деформированных энтропий (энтропия Реньи, Цаллиса, Шарма-Миттала) для анализа поведения тематических моделей как функции от гиперпараметров. В рамках данной работы коллекция документов и слов рассматривается в виде мезоскопической информационной системы, состояние которой описывается деформированными энтропиями, а поведение информационной системы определяется значениями гиперпараметров и числом кластеров/тем. Тематическое моделирование рассматривается как процедура упорядочивания информационный системы. Исходя из этого, проблема выбора оптимальных значений параметров тематических моделей сводится к задаче нахождения минимума свободной энергии или минимума параметризованной энтропии.
Диссертация [*.pdf, 75.21 Мб] (дата размещения 11.11.2022)
Резюме [*.pdf, 3.01 Мб] (дата размещения 11.11.2022)
Summary [*.pdf, 2.92 Мб] (дата размещения 11.11.2022)

Публикации, в которых излагаются основные результаты диссертации

Bodrunova S., Koltsov S., Koltsova O., Nikolenko S., Shimorina A. Interval semi-supervised LDA: Classifying needles in a haystack (смотреть на сайте журнала)


Сведения о результатах защиты:
Комитет по диссертации рекомендовал присудить ученую степень доктора компьютерных наук (протокол №2 от 01.02.2023). Решением диссертационного совета (протокол № 2 от 06.03.2023) присуждена ученая степень доктора компьютерных наук.