Команда проекта "Культурное наследие" начала работать над расшифровкой дневника адмирала Федора Петровича Литке
В рамках реализации задачи по автоматической расшифровке и интеллектуальному анализу рукописей сотрудники Института региональных исторических исследований обратились к оригинальному историческому источнику - дневнику адмирала Федора Петровича Литке. Особенностью данного исторического источника, помимо отсутствия на настоящее момент его полной ручной расшифровки, выступает сложная структура почерка автора, а также большое количество специальной терминологии и иностранных слов (морские термины, картографические понятия, вставки на нескольких иностранных языках и т.д.).
Привлечение нейронной сети и алгоритмов для строчной разметки позволило получить обнадеживающие первоначальные результаты: средние показатели ошибочно распознанных символов (CER) варьировались в диапазоне от 10 до 20 %. Планируется, что нейронная сеть, после процессов "дообучения", сможет верно распознавать более 90 из 100 символов в рукописи, что позволит в короткие сроки получить полную расшифровку всего дневника адмирала Литке.