Распознавание исторических рукописных документов с применением методов глубокого машинного обучения

Основное содержимое статьи

Т. Р. Мамедов
Н. М. Ершов

Аннотация

Настоящая работа посвящена разработке и анализу нейросетевых подходов и методов к решению задачи распознавания рукописных документов. Для решения данной задачи в работе предлагается использовать модели глубоких нейронных сетей. Рассматриваются вопросы конфигурации и обучения рассматриваемых моделей, также описываются и анализируются возможные их усовершенствования. Приводятся результаты численного исследования всех предложенных подходов и сравнение их эффективности в решении поставленной задачи.

Скачивания

Данные скачивания пока недоступны.

Информация о статье

Как цитировать
[1]
Мамедов, Т.Р. и Ершов, Н.М. 2024. Распознавание исторических рукописных документов с применением методов глубокого машинного обучения . Системный анализ в науке и образовании. 3 (сен. 2024), 46–53.
Выпуск
Раздел
Моделирование и анализ данных

Библиографические ссылки

Connectionist temporal classification: labelling unsegmented sequence data with recurrent neural networks / A. Graves, S. Fernandez, F. Gomez, J. Schmidhuber //Proceedings of the 23rd interna-tional conference on Machine learning. – 2006. – С. 369-376.

Graves, A. Offline Handwriting Recognition with Multidimensional Recurrent Neural Networks / A. Graves, J. Schmidhuber // Proceedings of the 21st International Conference on Neural Infor-mation Processing Systems (NIPS'08). – 2008. – С. 545-552.

Convolve, attend and spell: An attention-based sequence-to-sequence model for handwritten word recognition / L. Kang [et al.] //Pattern Recognition: 40th German Conference, GCPR 2018, Stuttgart, Germany, October 9-12, 2018, Proceedings 40. – Springer International Publishing, 2019. – С. 459-472.

TrOCR: Transformer-based Optical Character Recognition with Pre-trained Models / Minghao Li [et al.] // Proceedings of the AAAI Conference on Artificial Intelligence. – 2023. – Т. 37. – №. 11. – С. 13094-13102.

IAM: A Comprehensive and Large-Scale Dataset for Integrated Argument Mining Tasks / L. Cheng et al. // Proceedings of the 60th Annual Meeting of the Association for Computational Lin-guistics. – 2022. – Vol. 1. – С. 2277–2287.

Ba J. Layer Normalization / J. Ba, J. Kiros, G. Hinton // arXive.org e-Print archive. – 2016. – DOI: 10.48550/arXiv.1607.06450.

Exploring the limits of transfer learning with a unified text-to-text transformer / C. Raffel [et al.] //Journal of machine learning research. – 2020. – Т. 21. – №. 140. – С. 1-67. – URL: http://jmlr.org/papers/v21/20-074.html.

ICFHR 2014 competition on handwritten keyword spotting (H-KWS 2014) / I. Pratikakis [et al.] // 2014 14th International Conference on Frontiers in Handwriting Recognition. – IEEE, 2014. – С. 814-819. – DOI: 10.1109/ICFHR.2014.142.