• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Культурное наследие России: интеллектуальный анализ и тематическое моделирование корпуса рукописных текстов

Публикации:

Болтунова Е.М., Лаптев А.К., Ломов Н.А. Каторга и рождение новой политической риторики: анализ корпуса писем политических заключенных начала ХХ века // Имагология и компаративистика. 2023. № 20. С. 294–314.

Киселев В.С. Письма неустановленных лиц к В.А. Жуковскому: возможности машинного анализа и атрибуции рукописных документов // Имагология и компаративистика. 2023. № 20. С. 232–246.

Пенская Е.Н. "Дым и чад черновиков". Подходы к тематическому моделированию рукописных источников А. В. Сухово-Кобылина и родственных семейных кланов в российских архивах // Имагология и компаративистика. 2023. № 19. С. 213-233. 

Киселев В.С., Лебедева О.Б., Третьяков Е.О. Проблемы графической, синтаксической и семантической классификации рукописных документов рубежа XVIII–XIX вв. из российских архивов: возможности машинного анализа данных (на материале коллективных писем к В. А. Жуковскому) // Имагология и компаративистика. 2023. № 19. С. 165-187. 

Болтунова Е.М. Региональная история России: исследовательское поле и архивная практика (1990-е — начало 2020-х годов) // Новое литературное обозрение. 2022. № 6(178). С. 235-250.

Полный список публикаций доступен по ссылке.

Проект «Культурное наследие России: интеллектуальный анализ и тематическое моделирование корпуса рукописных текстов» (№22-68-00066) выполняется при поддержке Российского научного фонда.

В рамках настоящего проекта предлагается разработать систему автоматизированной навигации по рукописному тексту, предоставляющей пользователю данные о тематике, составе и структуре нерасшифрованной рукописи, а также осуществляющей моделирование корпуса рукописных текстов по запросу исследователя. В отличие от наиболее популярных подходов (распознавание всех символов текста, не реализуемое в настоящее время программным обеспечением любого класса), новая методика интеллектуального анализа данных сосредоточена на исследовании графических элементов.

Ряд задач исследования будет решен методами гуманитарных наук (графическая, синтаксическая и семантическая классификация текста), ряд – методами интеллектуального анализа данных (распознавание образов, навигация, кластеризация, анализ связей между компонентами текста). В качестве объектов изучения будет использован корпус высококачественных цифровых копий историко-литературных документов времени расцвета русской письменной культуры конца XVIII – середины XX вв., имеющих четко выраженную иерархическую и графическую организацию: письма, дневниковые записи, мемуары, записные книжки и рабочие тетради, оригиналы которых находятся в архивах России.

Новости

С 19 по 22 мая в Сербии прошёл международный форум "Россия и Балканы: цифровая экономика и технологии развития". Члены научного коллектива Елена Пенская и Леонид Местецкий приняли участие в секции "Цифровые технологии для экономики просвещения и популяризации научных исследований".
17 июня
15–16 апреля 2024 г. в Новосибирском государственном педагогическом университете состоялась Всероссийская научная конференция "Шестые Чумаковские чтения. Текст и претекст". Конференция была посвящена памяти доктора филологических наук, профессора, известного пушкиноведа Юрия Николаевича Чумакова.
22 апреля
8 апреля состоялся рабочий семинар участников проекта, посвящённый кейсу по расшифровке дневников адмирала Федора Петровича Литке.
15 апреля
Исследовательский коллектив закончил подготовку первого рабочего прототипа программы для просмотра и работы с расшифрованными рукописями дневника адмирала Федора Петровича Литке.
15 апреля
21 марта 2024 г. прошёл рабочий семинар, посвящённый кейсу А.В. Сухово-Кобылина. В рамках встречи были уточнены ближайшие задачи в рамках работы с рукописным наследием драматурга.
12 апреля
В 2024 году к научному коллективу проекта присоединился новый стажёр - Мария Долгова. В рамках работы проекта Мария войдёт в состав группы, занимающейся отбором и анализом мемуарно-дневникового корпуса XIX - середины XX вв. 
11 апреля
В издании "КоммерсантЪ-наука" был опубликован лонгрид Елены Пенской "Рождение литературного слова из духа математики: как технологии распознавания рукописных текстов помогают изучать творчество писателей".
14 марта
В специальном блоке журнала "Имагология и компаративистика" (№20), посвященном возможностям машинного анализа и атрибуции рукописных документов, опубликованы статьи Екатерины Болтуновой, Антона Лаптева, Никиты Ломова и Виталия Киселева (в соавторстве).
11 декабря, 2023 г.
При решении задач по расшифровке корпуса рукописных источников коллектив проекта "Культурное наследие" осуществил первичную расшифровку одного из томов личного дневника адмирала Федора Петровича Литке.
7 декабря, 2023 г.
Члены научного коллектива, представляющие группу математиков, планируют провести серию выступлений в рамках 21-й Всероссийской конференции с международным участием "Математические методы распознавания образов". Конференция организована Российской академией наук, Федеральным исследовательским центром "Информатика и управление" РАН и Национальным комитетом при Президиуме РАН по распознаванию образов и анализу изображений и состоится 12-15 декабря 2023 г. на площадке Федерального исследовательского центра "Информатика и управление" РАН.
5 декабря, 2023 г.
Еще новости