• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Сервис для извлечения данных из структурированных документов. Клиентская часть.

ФИО студента: Ким Макар Максимович

Руководитель: Салех Хади Мухаммед

Кампус/факультет: Факультет компьютерных наук

Программа: Программная инженерия (Бакалавриат)

Год защиты: 2024

Документооборот – незаменимый и трудоемкий процесс, широко используемый как предприятиями, так и частными лицами. Данная работа посвящена решению проблемы цифровизации документооборота. Работа рассматривает клиентскую часть системы для извлечения данных из структурированных документов различных форматов с использованием технологии оптического распознавания символов (OCR), её предметную область, архитектуру решения и применяемые методы. Вся система состоит из трех частей: клиентская часть, серверная часть и компонент распознавания. Клиентская часть, рассматриваемая в рамках этой работы является веб-приложением, ключевыми компонентами которого являются: модуль разметки документов, который в результате передает данные серверной части системы; система ролей, предоставляющая настройку доступа пользователей к данным в системе; аутентификация и авторизация пользователей; инструменты администрирования, позволяющие управлять пользователями и следить за состоянием системы в целом; инструменты аналитики и мониторинга, позволяющие следить за данными и действиями пользователей. Веб-приложение взаимодействует с серверной частью посредством сети интернет. Ожидается, что полученное в результате веб-приложение упростит процесс документооборота в целом и снизит риск ошибок, присущих ручной обработке документов. Работа содержит: 40 страниц, 3 главы, 27 рисунков, 22 источника и 6 приложений. Ключевые слова: извлечение данных, разметка документов, цифровизация документооборота, оптическое распознавание символов (OCR), администрирование и мониторинг.

Выпускные квалификационные работы (ВКР) в НИУ ВШЭ выполняют все студенты в соответствии с университетским Положением и Правилами, определенными каждой образовательной программой.

Аннотации всех ВКР в обязательном порядке публикуются в свободном доступе на корпоративном портале НИУ ВШЭ.

Полный текст ВКР размещается в свободном доступе на портале НИУ ВШЭ только при наличии согласия студента – автора (правообладателя) работы либо, в случае выполнения работы коллективом студентов, при наличии согласия всех соавторов (правообладателей) работы. ВКР после размещения на портале НИУ ВШЭ приобретает статус электронной публикации.

ВКР являются объектами авторских прав, на их использование распространяются ограничения, предусмотренные законодательством Российской Федерации об интеллектуальной собственности.

В случае использования ВКР, в том числе путем цитирования, указание имени автора и источника заимствования обязательно.

Реестр дипломов НИУ ВШЭ