Автоматизация структурной разметки исторических рукописей: интеграция методов машинного обучения и интерактивного редактирования
Основное содержимое статьи
Аннотация
В работе представлена информационная система для автоматизации структурной разметки архивных рукописей. Решена проблема утраты визуального контекста документа путем привязки текстовой расшифровки к координатам на изображении. Реализована клиент-серверная веб-архитектура с возможностью локального развертывания. Интеграция нейросетевых моделей YOLOv9 и TrOCR позволила автоматизировать сегментацию строк и распознавание текста. Разработан алгоритм сохранения разметки при геометрических преобразованиях сканов. Система обеспечивает формирование качественных обучающих выборок и ускоряет работу архивистов.
Скачивания
Информация о статье

Это произведение доступно по лицензии Creative Commons «Attribution» («Атрибуция») 4.0 Всемирная.
Библиографические ссылки
Transkribus - A Service Platform for Transcription, Recognition and Retrieval of Historical Documents / P. Kahle, S. Colutto, G. Hackl, G. Mühlberger // 2017 14th IAPR International Conference on Document Analysis and Recognition (ICDAR). IEEE, 2017. Vol. 4. Pp. 19-24. https://doi.org/10.1109/ICDAR.2017.307
eScriptorium: An Open Source Platform for Historical Document Analysis / B. Kiessling, R.Tissot, P. Stokes, D. S. B. Ezra // 2019 International Conference on Document Analysis and Recognition Workshops (ICDARW). IEEE, 2019. Vol. 2. Pp. 19-19. https://doi.org/10.1109/ICDARW.2019.10032.
OCR4all — An Open-Source Tool Providing a (Semi-)Automatic Evaluation Pipeline for Historical Printings / C. Reul, D. Christ, A. Hartelt [et al.] // Applied Sciences. 2019. Vol. 9, No. 22. Pp. 4853 https://doi.org/10.3390/app9224853
Булгаков И., Скоринкин Д. Как устроена оцифровка дневников: Михаил Мельниченко о проекте «Прожито» и его перезапуске // Системный Блокъ: Онлайн-журнал. Системный Блокъ, 2018–2026. URL: https://sysblok.ru/interviews/kak-ustroena-ocifrovka-dnevnikov-mihail-melnichenko-o-proekte-prozhito-i-ego-perezapuske/ (дата публикации: 18.01.2024).
Home - Trove // National Library of Australia: [сайт]. URL: https://trove.nla.gov.au/ (дата обращения: 05.04.2026).
Pletschacher S., Antonacopoulos A. The PAGE (Page Analysis and Ground-Truth Elements) Format Framework // 2010 20th International Conference on Pattern Recognition. IEEE, 2010. Pp. 257-260. DOI: 10.1109/ICPR.2010.72.
Wang C.Y., Yeh I.H., Liao H.Y.M. YOLOv9: Learning What You Want to Learn Using Programmable Gradient Information // arXiv : [electronic archive]. arXiv: 2402.13616. https://doi.org/10.48550/arXiv.2402.13616. Submitted on 21 Feb 2024.
TrOCR: Transformer-based Optical Character Recognition with Pre-trained Models / Minghao Li, Tengchao Lv, Jingye Chen [et al.] // arXiv : [electronic archive]. arXiv:2109.10282. https://doi.org/10.48550/arXiv.2109.10282. Submitted on 21 Sep 2021.