• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Культурное наследие России: интеллектуальный анализ и тематическое моделирование корпуса рукописных текстов

Публикации:

Болтунова Е.М., Лаптев А.К., Ломов Н.А. Каторга и рождение новой политической риторики: анализ корпуса писем политических заключенных начала ХХ века // Имагология и компаративистика. 2023. № 20. С. 294–314.

Киселев В.С. Письма неустановленных лиц к В.А. Жуковскому: возможности машинного анализа и атрибуции рукописных документов // Имагология и компаративистика. 2023. № 20. С. 232–246.

Пенская Е.Н. "Дым и чад черновиков". Подходы к тематическому моделированию рукописных источников А. В. Сухово-Кобылина и родственных семейных кланов в российских архивах // Имагология и компаративистика. 2023. № 19. С. 213-233. 

Киселев В.С., Лебедева О.Б., Третьяков Е.О. Проблемы графической, синтаксической и семантической классификации рукописных документов рубежа XVIII–XIX вв. из российских архивов: возможности машинного анализа данных (на материале коллективных писем к В. А. Жуковскому) // Имагология и компаративистика. 2023. № 19. С. 165-187. 

Болтунова Е.М. Региональная история России: исследовательское поле и архивная практика (1990-е — начало 2020-х годов) // Новое литературное обозрение. 2022. № 6(178). С. 235-250.

Полный список публикаций доступен по ссылке.

Проект «Культурное наследие России: интеллектуальный анализ и тематическое моделирование корпуса рукописных текстов» (№22-68-00066) выполняется при поддержке Российского научного фонда.

В рамках настоящего проекта предлагается разработать систему автоматизированной навигации по рукописному тексту, предоставляющей пользователю данные о тематике, составе и структуре нерасшифрованной рукописи, а также осуществляющей моделирование корпуса рукописных текстов по запросу исследователя. В отличие от наиболее популярных подходов (распознавание всех символов текста, не реализуемое в настоящее время программным обеспечением любого класса), новая методика интеллектуального анализа данных сосредоточена на исследовании графических элементов.

Ряд задач исследования будет решен методами гуманитарных наук (графическая, синтаксическая и семантическая классификация текста), ряд – методами интеллектуального анализа данных (распознавание образов, навигация, кластеризация, анализ связей между компонентами текста). В качестве объектов изучения будет использован корпус высококачественных цифровых копий историко-литературных документов времени расцвета русской письменной культуры конца XVIII – середины XX вв., имеющих четко выраженную иерархическую и графическую организацию: письма, дневниковые записи, мемуары, записные книжки и рабочие тетради, оригиналы которых находятся в архивах России.

Новости

17-18 октября 2024 г. в Перми состоялась IX Всероссийская научно-практическая конференция с международным участием "Искусственный интеллект в решении актуальных социальных и экономических проблем XXI века" на базе Пермского государственного национального исследовательского университета и Национального исследовательского университета "Высшая школа экономики" в Перми. Научный сотрудник Института Антон Лаптев выступил с докладом на тему "Интеллектуальный анализ дневника Ф.П. Литке: большие языковые модели и метаданные в процессе обработки естественного языка".
31 октября
С 19 по 22 мая в Сербии прошёл международный форум "Россия и Балканы: цифровая экономика и технологии развития". Члены научного коллектива Елена Пенская и Леонид Местецкий приняли участие в секции "Цифровые технологии для экономики просвещения и популяризации научных исследований".
17 июня
15–16 апреля 2024 г. в Новосибирском государственном педагогическом университете состоялась Всероссийская научная конференция "Шестые Чумаковские чтения. Текст и претекст". Конференция была посвящена памяти доктора филологических наук, профессора, известного пушкиноведа Юрия Николаевича Чумакова.
22 апреля
8 апреля состоялся рабочий семинар участников проекта, посвящённый кейсу по расшифровке дневников адмирала Федора Петровича Литке.
15 апреля
Исследовательский коллектив закончил подготовку первого рабочего прототипа программы для просмотра и работы с расшифрованными рукописями дневника адмирала Федора Петровича Литке.
15 апреля
21 марта 2024 г. прошёл рабочий семинар, посвящённый кейсу А.В. Сухово-Кобылина. В рамках встречи были уточнены ближайшие задачи в рамках работы с рукописным наследием драматурга.
12 апреля
В 2024 году к научному коллективу проекта присоединился новый стажёр - Мария Долгова. В рамках работы проекта Мария войдёт в состав группы, занимающейся отбором и анализом мемуарно-дневникового корпуса XIX - середины XX вв. 
11 апреля
В издании "КоммерсантЪ-наука" был опубликован лонгрид Елены Пенской "Рождение литературного слова из духа математики: как технологии распознавания рукописных текстов помогают изучать творчество писателей".
14 марта
В специальном блоке журнала "Имагология и компаративистика" (№20), посвященном возможностям машинного анализа и атрибуции рукописных документов, опубликованы статьи Екатерины Болтуновой, Антона Лаптева, Никиты Ломова и Виталия Киселева (в соавторстве).
11 декабря, 2023 г.
При решении задач по расшифровке корпуса рукописных источников коллектив проекта "Культурное наследие" осуществил первичную расшифровку одного из томов личного дневника адмирала Федора Петровича Литке.
7 декабря, 2023 г.
Еще новости