Методы и алгоритмы для извлечения, связывания, векторизации и разрешения неоднозначности лексико-семантических графовMethods and Algorithms for Extraction, Linking, Vectorisation, and Disambiguation of Lexical-Semantic Graphs
Соискатель:
Панченко Александр Иванович
Члены комитета:
Кольцов Сергей Николаевич ( НИУ ВШЭ Спб, д.комп. н., председатель комитета), Бурнаев Евгений Владимирович (профессор, д.ф.-м.н., член комитета), Николенко Сергей Игоревич (профессор, д.ф.-м.н., член комитета), Соловьев Валерий Дмитриевич (Казанский федеральный университет, д.ф.-м.н, член комитета), Воронцов Константин Вячеславович (ММП МГУ им. М. В. Ломоносова, д.ф.-м.н., член комитета)
Диссертация принята к предварительному рассмотрению:
6/13/2024
Диссертация принята к защите:
9/19/2024
Дисс. совет:
Совет по компьютерным наукам
Дата защиты:
12/18/2024
Диссертационная работа представляет собой комплексное исследование, направленное на разработку методов вычислительной лексической семантики, которые позволили бы преодолеть методологический разрыв между построенными вручную лексическими ресурсами, такими как WordNet, и дистрибутивными графами извлеченными из текстов. Для достижения этой цели, были разработаны новые методы и алгоритмы для (1) кластеризации больших лингвистических графов; (2) извлечения лексико-семантических структур из текста, таких как значения слов и отношения между ними; (3) устранения неоднозначности смысла слов и лексической замены в контексте; (4) связывания смыслов слов извлеченных из текста с лексическими ресурсами; (5) векторизации узлов лексико-семантических графов; (6) извлечения гиперонимов и построения таксономий. Эффективность предложенных методов и алгоритмов подтверждена в рамках большого числа вычислительных экспериментов и открытых тестирований. Реализация предложенных методов и другие материалы находятся в открытом доступе.
Диссертация [*.pdf, 12.74 Мб] (дата размещения 10/1/2024)
Резюме [*.pdf, 2.86 Мб] (дата размещения 10/1/2024)
Summary [*.pdf, 2.58 Мб] (дата размещения 10/1/2024)
Публикации, в которых излагаются основные результаты диссертации
Faralli S., Panchenko A., Biemann C., Ponzetto S.P. Linked Disambiguated Distributional Semantic Networks (смотреть на сайте журнала)
Pelevina M., Arefiev N., Biemann C., Panchenko A. Making Sense of Word Embeddings (смотреть на сайте журнала)
Panchenko A., Ruppert E., Faralli S., Ponzetto S.P., Biemann C. Unsupervised does not mean uninterpretable: The case for word sense induction and disambiguation (смотреть на сайте журнала)
Ustalov D., Arefyev N., Biemann C., Panchenko A. Negative Sampling Improves Hypernymy Extraction Based on Projection Learning (смотреть на сайте журнала)
Ustalov D., Panchenko A., Biemann C. Watset: Automatic Induction of Synsets from a Graph of Synonyms (смотреть на сайте журнала)
Panchenko A., Marten F., Ruppert E., Faralli S., Ustalov D., Ponzetto S.P., Biemann C. Unsupervised, Knowledge-Free, and Interpretable Word Sense Disambiguation (смотреть на сайте журнала)
Panchenko A., Ustalov D., Faralli S., Ponzetto S.P., Biemann C. Improving Hypernymy Extraction with Distributional Semantic Classes (смотреть на сайте журнала)
Ustalov D., Panchenko A., Kutuzov A., Biemann C., Ponzetto S.P. Unsupervised Semantic Frame Induction using Triclustering (смотреть на сайте журнала)
Biemann C., Faralli S., Panchenko A., Ponzetto S.P. A framework for enriching lexical semantic resources with distributional semantics (смотреть на сайте журнала)
Kutuzov A., Dorgham M., Oliynyk O., Biemann C., Panchenko A. Making Fast Graph-based Algorithms with Graph Metric Embeddings (смотреть на сайте журнала)
Aly R., Acharya S., Ossa A., Kohn A., Biemann C., Panchenko A. Every child should have parents: a taxonomy refinement algorithm based on hyperbolic term embeddings (смотреть на сайте журнала)
Ustalov D., Panchenko A., Biemann C., Ponzetto S.P. Watset: Local-Global Graph Clustering with Applications in Sense and Frame Induction (смотреть на сайте журнала)
Logacheva V., Teslenko D., Shelmanov A., Remus S., Ustalov D., Kutuzov A., Artemova E., Biemann C., Ponzetto S.P., Panchenko A. Word Sense Disambiguation for 158 Languages using Word Embeddings Only (смотреть на сайте журнала)
Arefyev N., Sheludko B., Podolskiy A., Panchenko A. Always Keep your Target in Mind: Studying Semantics and Improving Performance of Neural Lexical Substitution (смотреть на сайте журнала)
Отзывы
Отзыв члена Комитета
- Николенко Сергей Игоревич (дата размещения 12/3/2024)
- Воронцов Константин Вячеславович (дата размещения 12/3/2024)
- Соловьев Валерий Дмитриевич (дата размещения 12/3/2024)
- Кольцов Сергей Николаевич (дата размещения 12/3/2024)
- Бурнаев Евгений Владимирович (дата размещения 12/3/2024)
Сведения о результатах защиты:
Комитет по диссертации рекомендовал присудить ученую степень доктора наук с отличием (протокол № 2 от 18.12.2024); ;Решением диссертационного совета (протокол № 13 от 26.12.2024) присуждена ученая степень доктора компьютерных наук с отличием.
См. на ту же тему
Моделирование репродуктивного поведения россиян в периоды шоков 2000-2023 годовКандидатская диссертация
Соискатель: Горский Дмитрий Ильич
Руководитель: Вакуленко Елена Сергеевна
Разработка алгоритмов построения пайплайнов машинного обучения методами обработки естественного языка, основанными на данныхКандидатская диссертация
Соискатель: Трофимова Екатерина Алексеевна
Руководитель: Устюжанин Андрей Евгеньевич
Моделирование влияния сентимента на биржевые характеристики криптоактивовКандидатская диссертация
Соискатель: Бакланова Валерия Сергеевна
Руководитель: Теплова Тамара Викторовна