Автоматизация структурной разметки исторических рукописей: интеграция методов машинного обучения и интерактивного редактирования

Основное содержимое статьи

А. К. Бабкин
М. Ю. Ушанкова

Аннотация

В работе представлена информационная система для автоматизации структурной разметки архивных рукописей. Решена проблема утраты визуального контекста документа путем привязки текстовой расшифровки к координатам на изображении. Реализована клиент-серверная веб-архитектура с возможностью локального развертывания. Интеграция нейросетевых моделей YOLOv9 и TrOCR позволила автоматизировать сегментацию строк и распознавание текста. Разработан алгоритм сохранения разметки при геометрических преобразованиях сканов. Система обеспечивает формирование качественных обучающих выборок и ускоряет работу архивистов.

Скачивания

Данные скачивания пока недоступны.

Информация о статье

Как цитировать
[1]
Бабкин, А.К. и Ушанкова, М.Ю. 2026. Автоматизация структурной разметки исторических рукописей: интеграция методов машинного обучения и интерактивного редактирования. Системный анализ в науке и образовании. 2 (июн. 2026), 1–9.
Выпуск
Раздел
Системный анализ в прикладных задачах

Библиографические ссылки

Transkribus - A Service Platform for Transcription, Recognition and Retrieval of Historical Documents / P. Kahle, S. Colutto, G. Hackl, G. Mühlberger // 2017 14th IAPR International Conference on Document Analysis and Recognition (ICDAR). IEEE, 2017. Vol. 4. Pp. 19-24. https://doi.org/10.1109/ICDAR.2017.307

eScriptorium: An Open Source Platform for Historical Document Analysis / B. Kiessling, R.Tissot, P. Stokes, D. S. B. Ezra // 2019 International Conference on Document Analysis and Recognition Workshops (ICDARW). IEEE, 2019. Vol. 2. Pp. 19-19. https://doi.org/10.1109/ICDARW.2019.10032.

OCR4all — An Open-Source Tool Providing a (Semi-)Automatic Evaluation Pipeline for Historical Printings / C. Reul, D. Christ, A. Hartelt [et al.] // Applied Sciences. 2019. Vol. 9, No. 22. Pp. 4853 https://doi.org/10.3390/app9224853

Булгаков И., Скоринкин Д. Как устроена оцифровка дневников: Михаил Мельниченко о проекте «Прожито» и его перезапуске // Системный Блокъ: Онлайн-журнал. Системный Блокъ, 2018–2026. URL: https://sysblok.ru/interviews/kak-ustroena-ocifrovka-dnevnikov-mihail-melnichenko-o-proekte-prozhito-i-ego-perezapuske/ (дата публикации: 18.01.2024).

Home - Trove // National Library of Australia: [сайт]. URL: https://trove.nla.gov.au/ (дата обращения: 05.04.2026).

Pletschacher S., Antonacopoulos A. The PAGE (Page Analysis and Ground-Truth Elements) Format Framework // 2010 20th International Conference on Pattern Recognition. IEEE, 2010. Pp. 257-260. DOI: 10.1109/ICPR.2010.72.

Wang C.Y., Yeh I.H., Liao H.Y.M. YOLOv9: Learning What You Want to Learn Using Programmable Gradient Information // arXiv : [electronic archive]. arXiv: 2402.13616. https://doi.org/10.48550/arXiv.2402.13616. Submitted on 21 Feb 2024.

TrOCR: Transformer-based Optical Character Recognition with Pre-trained Models / Minghao Li, Tengchao Lv, Jingye Chen [et al.] // arXiv : [electronic archive]. arXiv:2109.10282. https://doi.org/10.48550/arXiv.2109.10282. Submitted on 21 Sep 2021.

Наиболее читаемые статьи этого автора (авторов)