Методы и алгоритмы для извлечения, связывания, векторизации и разрешения неоднозначности лексико-семантических графовMethods and Algorithms for Extraction, Linking, Vectorisation, and Disambiguation of Lexical-Semantic Graphs
Соискатель:
Панченко Александр Иванович
Члены комитета:
Кольцов Сергей Николаевич ( НИУ ВШЭ Спб, д.комп. н., председатель комитета), Бурнаев Евгений Владимирович (профессор, д.ф.-м.н., член комитета), Николенко Сергей Игоревич (профессор, д.ф.-м.н., член комитета), Соловьев Валерий Дмитриевич (Казанский федеральный университет, д.ф.-м.н, член комитета), Воронцов Константин Вячеславович (ММП МГУ им. М. В. Ломоносова, д.ф.-м.н., член комитета)
Диссертация принята к предварительному рассмотрению:
6/13/2024
Диссертация принята к защите:
9/19/2024
Дисс. совет:
Совет по компьютерным наукам
Дата защиты:
12/18/2024
Диссертационная работа представляет собой комплексное исследование, направленное на разработку методов вычислительной лексической семантики, которые позволили бы преодолеть методологический разрыв между построенными вручную лексическими ресурсами, такими как WordNet, и дистрибутивными графами извлеченными из текстов. Для достижения этой цели, были разработаны новые методы и алгоритмы для (1) кластеризации больших лингвистических графов; (2) извлечения лексико-семантических структур из текста, таких как значения слов и отношения между ними; (3) устранения неоднозначности смысла слов и лексической замены в контексте; (4) связывания смыслов слов извлеченных из текста с лексическими ресурсами; (5) векторизации узлов лексико-семантических графов; (6) извлечения гиперонимов и построения таксономий. Эффективность предложенных методов и алгоритмов подтверждена в рамках большого числа вычислительных экспериментов и открытых тестирований. Реализация предложенных методов и другие материалы находятся в открытом доступе.
Диссертация [*.pdf, 12.74 Мб] (дата размещения 10/1/2024)
Резюме [*.pdf, 2.86 Мб] (дата размещения 10/1/2024)
Summary [*.pdf, 2.58 Мб] (дата размещения 10/1/2024)
Публикации, в которых излагаются основные результаты диссертации
Faralli S., Panchenko A., Biemann C., Ponzetto S.P. Linked Disambiguated Distributional Semantic Networks (смотреть на сайте журнала)
Pelevina M., Arefiev N., Biemann C., Panchenko A. Making Sense of Word Embeddings (смотреть на сайте журнала)
Panchenko A., Ruppert E., Faralli S., Ponzetto S.P., Biemann C. Unsupervised does not mean uninterpretable: The case for word sense induction and disambiguation (смотреть на сайте журнала)
Ustalov D., Arefyev N., Biemann C., Panchenko A. Negative Sampling Improves Hypernymy Extraction Based on Projection Learning (смотреть на сайте журнала)
Ustalov D., Panchenko A., Biemann C. Watset: Automatic Induction of Synsets from a Graph of Synonyms (смотреть на сайте журнала)
Panchenko A., Marten F., Ruppert E., Faralli S., Ustalov D., Ponzetto S.P., Biemann C. Unsupervised, Knowledge-Free, and Interpretable Word Sense Disambiguation (смотреть на сайте журнала)
Panchenko A., Ustalov D., Faralli S., Ponzetto S.P., Biemann C. Improving Hypernymy Extraction with Distributional Semantic Classes (смотреть на сайте журнала)
Ustalov D., Panchenko A., Kutuzov A., Biemann C., Ponzetto S.P. Unsupervised Semantic Frame Induction using Triclustering (смотреть на сайте журнала)
Biemann C., Faralli S., Panchenko A., Ponzetto S.P. A framework for enriching lexical semantic resources with distributional semantics (смотреть на сайте журнала)
Kutuzov A., Dorgham M., Oliynyk O., Biemann C., Panchenko A. Making Fast Graph-based Algorithms with Graph Metric Embeddings (смотреть на сайте журнала)
Aly R., Acharya S., Ossa A., Kohn A., Biemann C., Panchenko A. Every child should have parents: a taxonomy refinement algorithm based on hyperbolic term embeddings (смотреть на сайте журнала)
Ustalov D., Panchenko A., Biemann C., Ponzetto S.P. Watset: Local-Global Graph Clustering with Applications in Sense and Frame Induction (смотреть на сайте журнала)
Logacheva V., Teslenko D., Shelmanov A., Remus S., Ustalov D., Kutuzov A., Artemova E., Biemann C., Ponzetto S.P., Panchenko A. Word Sense Disambiguation for 158 Languages using Word Embeddings Only (смотреть на сайте журнала)
Arefyev N., Sheludko B., Podolskiy A., Panchenko A. Always Keep your Target in Mind: Studying Semantics and Improving Performance of Neural Lexical Substitution (смотреть на сайте журнала)
Отзывы
Отзыв члена Комитета
- Бурнаев Евгений Владимирович (дата размещения 12/3/2024)
- Николенко Сергей Игоревич (дата размещения 12/3/2024)
- Соловьев Валерий Дмитриевич (дата размещения 12/3/2024)
- Воронцов Константин Вячеславович (дата размещения 12/3/2024)
- Кольцов Сергей Николаевич (дата размещения 12/3/2024)
См. на ту же тему
Приложение машинного обучения к теоретико-игровым задачам: аукционы и марковские игрыКандидатская диссертация
Соискатель: Иванов Дмитрий Игоревич
Руководитель: Нестеров Александр Сергеевич
Разработка алгоритмов построения пайплайнов машинного обучения методами обработки естественного языка основанными на данныхКандидатская диссертация
Соискатель: Трофимова Екатерина Алексеевна
Руководитель: Устюжанин Андрей Евгеньевич
Применение глубоких генеративных моделей для задач прогнозирования в машинном обученииКандидатская диссертация
Соискатель: Баранчук Дмитрий Александрович
Руководитель: Бабенко Артем Валерьевич
Дата защиты: 12/24/2024