• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Культурное наследие России: интеллектуальный анализ и тематическое моделирование корпуса рукописных текстов

Публикации:

Полный список публикаций доступен по ссылке.

Киселев В.С., Кропотов Д.А., Пронина Н.М. Сиамская сеть, машинная атрибуция почерка и неизвестный Жуковский // Имагология и компаративистика. 2024. № 22. C. 156-179.

Lomov N., Kropotov D., Stepochkin D., Laptev A. Handwritten Text Recognition and Browsing in Archive of Prisoners' Letters from Smolensk Convict Prison // Lecture Notes in Computer Science (LNCS). 2025

Болтунова Е.М., Лаптев А.К., Ломов Н.А. Каторга и рождение новой политической риторики: анализ корпуса писем политических заключенных начала ХХ века // Имагология и компаративистика. 2023. № 20. С. 294–314.

Киселев В.С. Письма неустановленных лиц к В.А. Жуковскому: возможности машинного анализа и атрибуции рукописных документов // Имагология и компаративистика. 2023. № 20. С. 232–246.

Пенская Е.Н. "Дым и чад черновиков". Подходы к тематическому моделированию рукописных источников А. В. Сухово-Кобылина и родственных семейных кланов в российских архивах // Имагология и компаративистика. 2023. № 19. С. 213-233. 

Киселев В.С., Лебедева О.Б., Третьяков Е.О. Проблемы графической, синтаксической и семантической классификации рукописных документов рубежа XVIII–XIX вв. из российских архивов: возможности машинного анализа данных (на материале коллективных писем к В. А. Жуковскому) // Имагология и компаративистика. 2023. № 19. С. 165-187. 

Болтунова Е.М. Региональная история России: исследовательское поле и архивная практика (1990-е — начало 2020-х годов) // Новое литературное обозрение. 2022. № 6(178). С. 235-250.

Проект «Культурное наследие России: интеллектуальный анализ и тематическое моделирование корпуса рукописных текстов» (№22-68-00066) выполняется при поддержке Российского научного фонда.

В рамках настоящего проекта предлагается разработать систему автоматизированной навигации по рукописному тексту, предоставляющей пользователю данные о тематике, составе и структуре нерасшифрованной рукописи, а также осуществляющей моделирование корпуса рукописных текстов по запросу исследователя. В отличие от наиболее популярных подходов (распознавание всех символов текста, не реализуемое в настоящее время программным обеспечением любого класса), новая методика интеллектуального анализа данных сосредоточена на исследовании графических элементов.

Ряд задач исследования будет решен методами гуманитарных наук (графическая, синтаксическая и семантическая классификация текста), ряд – методами интеллектуального анализа данных (распознавание образов, навигация, кластеризация, анализ связей между компонентами текста). В качестве объектов изучения будет использован корпус высококачественных цифровых копий историко-литературных документов времени расцвета русской письменной культуры конца XVIII – середины XX вв., имеющих четко выраженную иерархическую и графическую организацию: письма, дневниковые записи, мемуары, записные книжки и рабочие тетради, оригиналы которых находятся в архивах России.

Новости

В журнале "Имагология и компаративистика" (№ 22 за 2024 г.) опубликована статья В.С. Киселева и Д.А. Кропотова "Сиамская сеть, машинная атрибуция почерка и неизвестный Жуковский" (в соавторстве с Н.М. Прониной). Материал подготовлен в рамках совместной работы филологов и математиков.
16 декабря
На портале "Регионы России в исторической перспективе" опубликована статья А.К. Лаптева "Декодируя рукопись: перспективы использования искусственного интеллекта в рамках автоматизации работы с архивными историческими источниками".
12 декабря
С 17 по 20 октября прошла XII международная конференция "Analysis of Images, Social Networks and Texts" (AIST). В рамках конференции участники проекта Н. Ломов и Д. Кропотов представили доклад "YOLO-HTR: Page-Level Recognition of Historical Handwritten Document Collections".
8 декабря
В журнале “Programming and Computer Software” (Т. 50(4) за 2024 г.) опубликована статья Л.М. Местецкого "Constructing the Internal Voronoi Diagram of Polygonal Figure Using the Sweepline Method”.
3 декабря
28 ноября 2024 г. состоялся круглый стол "Digitalia Humaniora: память о будущем" в рамках научного форума "Гуманитарные науки в XXI веке: между текстом и цифрой", посвященный 10-летию Факультета гуманитарных наук НИУ ВШЭ. В работе круглого стола принял участие научный сотрудник Института Антон Лаптев с докладом на тему "Большие языковые модели и метаданные в процессе обработки естественного языка".
2 декабря
17-18 октября 2024 г. в Перми состоялась IX Всероссийская научно-практическая конференция с международным участием "Искусственный интеллект в решении актуальных социальных и экономических проблем XXI века" на базе Пермского государственного национального исследовательского университета и Национального исследовательского университета "Высшая школа экономики" в Перми. Научный сотрудник Института Антон Лаптев выступил с докладом на тему "Интеллектуальный анализ дневника Ф.П. Литке: большие языковые модели и метаданные в процессе обработки естественного языка".
31 октября
Завершена работа по распознаванию текста дневника адмирала, основателя Императорского российского географического общества Ф.П. Литке из фондов Государственного архива Российской Федерации методами искусственного интеллекта с использованием комбинации математических методов (методика восстановления траектории пера автора и нейронные сети).
20 октября
С 18 по 20 сентября на базе Национального исследовательского Томского государственного университета прошли Вторые Международные научные чтения памяти Александра Сергеевича Янушкевича, приуроченные к 80-летию со дня его рождения. В конференции приняла участие Елена Пенская, выступив с докладом "Римский травелог архимандрита Палладия в письмах 1860-х годов художнице Софье Сухово-Кобылиной".
28 сентября
В 149 томе журнале "Slavic Literatures" (ранее – "Russian Literature") опубликована новая статья Елены Пенской "«Литература в кавычках». Наследие Козьмы Пруткова и акционизм XX века" ("«Literature in Quotation Marks». Kozma Prutkov’s Legacy and 20th Century Actionism").
28 августа
Еще новости