Разработка методов автоматической структуризации и дефрагментации изображений текстовых документов

Основное содержимое статьи

Д. А. Горшков
Н. М. Ершов

Аннотация

Работа посвящена исследованиям способов сегментации изображений и методов автоматического распознавания стилей форматирования заданного текстового блока. Целью работы является разработка методов автоматической структуризации и дефрагментации изображений текстовых документов, т.е. нужно произвести сегментацию текстового фрагмента на изображении с дальней-шей программной реализацией автоматической классификации текстовых фрагментов. В работе предложен алгоритм сегментации изображений, основанный на пороговой сегментации. Такой алгоритм позволяет достичь достаточно точной сегментации изображений. Проводится обзор разработанных методов распознавания стилей, описывается актуальность проводимого исследования. Также проводится численное исследование методов. Описывается программная реализация предложенных алгоритмов и методов, с использованием языка программирования Python, демонстрируются примеры работы программы на изображениях с текстовыми блоками. Были проведены тесты разработанных методов на двух выборках текстовых изображений, для этого были сгенерированы тестовые изображений с помощью языка программирования Python, библиотеки ImageMagic и системы компьютерной верстки Latex. Проведенное тестирование показало перспективность предложенных подходов и методов к структуризации и классификации текстовых блоков.

Скачивания

Данные скачивания пока недоступны.

Информация о статье

Как цитировать
[1]
Горшков, Д.А. и Ершов, Н.М. 2022. Разработка методов автоматической структуризации и дефрагментации изображений текстовых документов. Системный анализ в науке и образовании. 2 (июл. 2022), 56–66.
Раздел
Статьи

Библиографические ссылки

Santos R., Clemente G. S., Ing Ren T., Calvalcanti G. Text Line Segmentation Based on Morphology and Histogram Projection // Document Analysis and Recognition, 10th International Conference on, 2009. Pp. 651-655. DOI: 10.1109/ICDAR.2009.183.

Likforman-Sulem L., Zahour A., Taconet B. Text line segmentation of historical documents: a survey // International Journal on Document Analysis and Recognition. 2007. № 9. Pp. 123-138. DOI:10.1007/s10032-006-0023-z.

Shapiro L. G., Stockman G. C. Computer Vision. New Jersey: Prentice-Hal, 2001. 580 pp. ISBN 0-13030796-3.

Sagar B. M., Shobha G. , Ramakhanth Kumar P. Converting printed Kannada text image file to machine editable format using Database // International Journal of Computers. 2008. Vol. 2. Pp. 173–175.

Srihari S. N., Govindaraju V., Shekhawat A. Interpretation of Handwritten Addresses in US Mailstream // Proceedings of 2nd International Conference on Document Analysis and Recognition (ICDAR '93). 1993. Pp. 291–294. DOI: 10.1109/ICDAR.1993.395729.

Maloo M., Kale K. V. Gujarati Script Recognition: A Review // International Journal of Computer Science Issues.2011. Vol. 8, Issue 4, № 1. Pp. 480–489.

Patil S. B. Neural Network based bilingual OCR system: experiment with English and Kannada bilingual document // International Journal of Computer Applications. 2011. Vol. 13, № 8. Pp. 6–14.

Thungamani M. and Ramakhanth Kumar P. A Survey of Methods and Strategies in Handwritten Kannada Character Segmentation // International Journal of Science Research. 2012. Vol 01, Issue 01. Pp. 18–23.

Das M. S., Reddy C. R. K., Govardhan A., Saikrishna G. Segmentation of Overlapping Text lines, Characters in printed Telugu text document images // International Journal of Engineering Science and Technology. 2010. Vol. 2(11). Pp. 6606–6610.

Arica N.,Yarman-Vural Fatos T. An Overview of Character Recognition Focused on Off-Line Handwriting // IEEE Transactions. Systems, Man, and Cybernetics. Part C: Applications and Reviews. 2001. Vol.

Pp. 216–233. DOI: 10.1109/5326.941845.

Marinai S., Nesi P. Projection Based Segmentation of Musical Sheets //Document Analysis and Recognition. 1999. Pp. 515–518. DOI: 10.1109/ICDAR.1999.791838.

Junga K., Kimb K. I., Jain A. K. Text information extraction in images and video: A survey// Pattern Recognition. 2004. Vol. 37. Pp. 977–997. DOI: 10.1016/j.patcog.2003.10.012.

Pham D. L.; Xu Ch. Prince J. Current Methods in Medical Image Segmentation // Annual Review of Biomedical Engineering. 2000. Vol. 2. Pp. 315–337. DOI: 10.1146/annurev.bioeng.2.1.315.

Lew M. S., Sebe N., Djeraba C., Jain R. Content-based Multimedia Information Retrieval: State of the

Art and Challenges // ACM Transactions on Multimedia Computing, Communications, and Applications. 2006. Vol. 2, № 1. Pp. 1–19. DOI:10.1145/1126004.1126005.

Naramala V. R., Srikrishna A., Bhogapathi R., Babu G. An efficient feature extraction and classification of handwritten digits using neural networks // International Journal of Computer Science, Engineering and Applications. 2011. Vol.1, № .5. Pp. 47–56. DOI: 10.5121/ijcsea.2011.1505.

Xiaoyan Z., Yifan S. New Algorithm for Handwritten Character Recognition. Beijing, China.

Aboeleneen Z. A, Abdel Azim G. An Improved Image Segmentation Algorithm Based on MET Method[J] // International Journal of Computer Science Issues. 2012. Vol. 9, Issue 5, № 3. Pp. 346–351.

Xu C., Huang F., Mao Z. An improved two-dimensional Otsu thresholding segmentation method[J] // Application of Electronic Technique, 2016.

Zhao H, Wang Q, Wu W, Yuan N. An Improved Method Research of SAR Images Thresholding Segmentation // Lecture Notes in Electrical Engineering, 2014. Vol. 238. Pp. 1151–1157. DOI: 10.1007/9781-4614-4981-2-125.

Wang Y. Q., Zhuang L. L., Shi C. X. Construction Research on Multi-Threshold Segmentation Based on Improved Otsu Threshold Method // Advanced Materials Research. 2014. Vol.1046. Pp. 425–428. DOI:

4028/www.scientific.net/AMR.1046.425.