Мы используем файлы cookies для улучшения работы сайта НИУ ВШЭ и большего удобства его использования. Более подробную информацию об использовании файлов cookies можно найти здесь, наши правила обработки персональных данных – здесь. Продолжая пользоваться сайтом, вы подтверждаете, что были проинформированы об использовании файлов cookies сайтом НИУ ВШЭ и согласны с нашими правилами обработки персональных данных. Вы можете отключить файлы cookies в настройках Вашего браузера.

  • A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Модели, алгоритмы и программные комплексы обработки текстовых данных на основе решеток замкнутых описаний

Ведущая организация:
Институт системного анализа РАН (сведения о ведущей организации)
Оппоненты:
Аншаков Олег Михайлович (сведения об оппоненте  [*.pdf, 320.16 Кб]); Лукашевич Наталья Валентиновна (сведения об оппоненте  [*.pdf, 351.64 Кб])
Специальность:
05.13.18 Математическое моделирование, численные методы и комплексы программ
Диссертация принята к защите:
22.06.2015 (протокол № 3)
Дисс. совет:
Д 212.048.09 - Совет по техническим и физико-математическим наукам
Дата защиты:
26.10.2015
В диссертационной работе рассмотрены модели текстов на естественном языке, предназначенные для поиска, классификации и кластеризации текстовых данных. Разработана графовая модель текстов, использующая и обобщающая модель структурного синтактико-семантического представления текстового абзаца (чащу разбора). Модель использует синтаксические деревья разбора и дискурсивные связи для представления текстовых абзацев на английском языке. Предложенная модель реализована в задаче поиска ответов по сложным запросам. Разработан метод, позволяющий улучшить качество поиска и устранить недостатки существующих моделей. Также модель текстовых данных реализована в виде численного метода, использующего ядерные функции. Применение модели позволяет улучшить качество работы существующих моделей в задаче классификации текстов благодаря ранее не применявшемуся в задачах классификации абзацев использованию семантической информации. Разработано таксономическое представление коллекции текстовых данных в виде решетки замкнутых структурных синтактико-семантических описаний. Разработана на основе модели текстов и теории решеток замкнутых описаний оригинальная модель тождественных денотатов для формальных описаний. Предложенная модель применена в задаче построения связей типа «та же сущность» в моделях текстов и реализована в виде численного метода и алгоритма, использующих оригинальный индекс ранжирования замкнутых формальных описаний для нахождения денотатов. Создан единый программный комплекс для работы с текстовыми данными. Также в рамках работы модифицирован программный комплекс для обработки данных на основе решеток замкнутых описаний, представляющий собой универсальное средство поддержки полного цикла исследований и позволяющий повысить эффективность решения ряда задач в области анализа данных.

Объявление о защите (дата размещения 10.07.2015)
Защита состоится 26 октября 2015 г. в 14-00 по адресу: г. Москва, ул. Кирпичная, 33, ауд. 503 

Диссертация [*.pdf, 2.29 Мб] (дата размещения 24.09.2014)
Автореферат [*.pdf, 543.34 Кб] (дата размещения 27.10.2014)

Отзывы
Отзыв научного руководителя
Сведения о результатах защиты:
На заседании диссертационного совета Д 212.048.09 от 26.10.2015, протокол №13, принято решение об отказе в присуждении ученой степени кандидата технических наук Ильвовскому Дмитрию Алексеевичу согласно п.34 "Положения о совете по защите диссертаций на соискание ученой степени кандидата наук, на соискание ученой степени доктора наук" от 13.01.2014г.
Члены диссертационного совета, присутствовавшие на заседании:
Список членов совета.doc (дата размещения 3.11.2015)