Разработка методов и алгоритмов анализа характеристик текстов на естественном языке на основе теоретико-информационного подхода и применение их к задачам защиты информацииDevelopment of methods and algorithms for analyzing the characteristics of natural language texts based on the information theory approach for application to information security tasks
Соискатель:
Руководитель:
Члены комитета:
Евсютин Олег Олегович (Национальный исследовательский университет «Высшая школа экономики», к.т.н., председатель комитета), Арбеков Игорь Михайлович (Общество с ограниченной ответственностью «СФБ Лаб», к.ф.-м. н., член комитета), Иванов Федор Ильич («Национальный исследовательский университет «Высшая школа экономики», Доктор наук по прикладной математике, член комитета), Крук Евгений Аврамович («Национальный исследовательский университет «Высшая школа экономики», д.т.н., член комитета), Сергеев Михаил Борисович («Санкт-Петербургский государственный университет аэрокосмического приборостроения», д.т.н, член комитета)
Диссертация принята к предварительному рассмотрению:
7/17/2024
Диссертация принята к защите:
8/29/2024
Дисс. совет:
Совет по инженерным наукам и прикладной математике
Дата защиты:
10/17/2024
Диссертационное исследование посвящено разработке методов и алгоритмов на основе теоретико-информационного подхода, предназначенных для анализа характеристик текстов на естественном языке. Предлагаемые методы позволяют сформировать прикладную базу для исследования и численно оценивать информационные характеристики текстов и параметры источника сообщений. С помощью разработанных алгоритмов формируются корпуса текстов и словари s-грамм. Предлагаемые математические модели позволяют получить численные оценки покрытия созданных словарей s-грамм. Разработан метод оценки энтропии s-грамм, основанный на статистических характеристиках словарей, без привлечения вероятностной модели. На основе теоретико-информационного подхода разработан и исследован метод восстановления s-грамм входных сообщений. Проведен анализ границ допустимой многозначности восстановления s-грамм сообщения.
Диссертация [*.pdf, 2.17 Мб] (дата размещения 7/17/2024)
Резюме [*.pdf, 483.79 Кб] (дата размещения 7/17/2024)
Summary [*.pdf, 454.71 Кб] (дата размещения 7/17/2024)
Публикации, в которых излагаются основные результаты диссертации
Построение и анализ моделей русского языка в связи с исследованиями криптографических алгоритмов (смотреть на сайте журнала)
The Combinatorial Analysis of n-Gram Dictionaries, Coverage and Information Entropy based on the Web Corpus of English (смотреть на сайте журнала)
Possibility of Recovering Message Segments Based on Side Information about Original Characters (смотреть на сайте журнала)
Отзывы
Отзыв научного руководителя
- Отзыв Лося А.Б. (дата размещения 7/16/2024)
Отзыв члена Комитета
- отзыв члена Комитета Иванова Ф.И. (дата размещения 10/7/2024)
- отзыв члена Комитета Крука Е.А. (дата размещения 10/7/2024)
- отзыв члена Комитета Арбекова И.М. (дата размещения 10/7/2024)
- отзыв председателя Комитета Евсютина О.О. (дата размещения 10/7/2024)
- отзыв члена Комитета Сергеева М.Б. (дата размещения 10/7/2024)
Сведения о результатах защиты:
Комитет по диссертации рекомендовал диссертационному совету присудить ученую степень кандидата наук (Протокол №2 от 17.10.2024г.) Решением диссертационного совета присуждена ученая степень кандидата наук (Протокол № 30 от 29.10.2024)
Ключевые слова: