Мы используем файлы cookies для улучшения работы сайта НИУ ВШЭ и большего удобства его использования. Более подробную информацию об использовании файлов cookies можно найти здесь, наши правила обработки персональных данных – здесь. Продолжая пользоваться сайтом, вы подтверждаете, что были проинформированы об использовании файлов cookies сайтом НИУ ВШЭ и согласны с нашими правилами обработки персональных данных. Вы можете отключить файлы cookies в настройках Вашего браузера.

  • A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Модели и методы автоматической обработки неструктурированных данных в биомедицинской областиModels and methods for automatic processing of unstructured data in biomedical domain

Члены комитета:
Воронцов Константин Вячеславович (МГУ им. М.В.Ломоносова, д.ф.-м.н., председатель комитета), Бурнаев Евгений Владимирович (Сколковский институт науки и технологий, д.ф.-м.н., член комитета), Грибова Валерия Викторовна (ФГБУН Институт автоматики и процессов управления Дальневосточного отделения РАН, д.т.н., член комитета), Кобринский Борис Аркадьевич (ФИЦ "Информатика и управление" РАН, д.м.н., член комитета), Кольцов Сергей Николаевич (НИУ ВШЭ в Санкт-Петербурге, д.комп.н., член комитета)
Диссертация принята к предварительному рассмотрению:
27.07.2023
Диссертация принята к защите:
9.10.2023
Дисс. совет:
Совет по компьютерным наукам
Дата защиты:
7.11.2023
Диссертационная работа представляет собой комплексное исследование, направленное на улучшение эффективности моделей и методов автоматической обработки текстов в биомедицинской области на основе современных языковых моделей архитектуры Трансформер. Разработаны новые модели и методы классификации и извлечения информации, в том числе модель связывания именованных сущностей, оптимизирующая сходство представлений сущностей и концептов, многоязычные модели для распознавания именованных сущностей, мультимодальные методы для обнаружения побочных реакций на лекарственные препараты. Впервые предложены и созданы аннотированные корпуса текстов на английском и русском языках из различных биомедицинских источников: научные абстракты (корпус NEREL-BIO), пользовательские отзывы о лекарствах (RuDReC), электронные медицинские карты (RuCCoN) и клинические испытания. Предложены новые подходы к оценке моделей связывания именованных сущностей. Эффективность предложенных моделей и методов подтверждена в рамках большого числа вычислительных экспериментов и открытых тестирований CLEF eHealth 2017 Task 1, #SMM4H Shared Tasks 2019-2021 годов. Предложенные корпуса, кодовая база и другие материалы находятся в открытом доступе.
Диссертация [*.pdf, 10.78 Мб] (дата размещения 27.07.2023)
Резюме [*.pdf, 1.89 Мб] (дата размещения 27.07.2023)
Summary [*.pdf, 1.81 Мб] (дата размещения 27.07.2023)

Публикации, в которых излагаются основные результаты диссертации



Сведения о результатах защиты:
Комитет по диссертации рекомендовал присудить ученую степень доктора наук (протокол №2 от 07.11.2023). Решением диссертационного совета (протокол № 14 от 24.11.2023) присуждена ученая степень доктора компьютерных наук.