Том 14 (2023) .– Выпуск 1 (56) .– Статья № 1 (422)

Искусственный интеллект и машинное обучение

Научная статья

Распознавание табличной информации с использованием свёрточных нейронных сетей

Игорь Викторович ВинокуровПереписывавшийся автор

Финансовый Университет при Правительстве Российской Федерации, Москва, Россия
Игорь Викторович Винокуров — Переписывавшийся автор igvvinokurov@fa.ru

Аннотация. Показана актуальность выявления табличной информации и распознавания её содержимого для обработки отсканированных документов. Описано формирование набора данных для обучения, валидации и тестирования нейронной сети глубокого обучения (DNN) YOLOv5s для обнаружения простых таблиц. Отмечена эффективность использования этой DNN при работе с отсканированными документами. С использованием Keras Functional API сформирована свёрточная нейронная сеть (CNN) для распознавания основных элементов табличной информации — цифр, основных знаков препинания и букв кириллицы. Приведены результаты исследования работы этой CNN. Описана реализация выявления и распознавания табличной информации на отсканированных документах в разработанной ИС актуализации информации в базах данных системы ЕГРН Росреестра. (Связанные тексты статьи на русском и на английском).

Ключевые слова: Свёрточные нейронные сети, нейронные сети глубокого обучения, CNN, DNN, YOLOv5s, Keras, Python

Для цитирования: Винокуров И. В. Распознавание табличной информации с использованием свёрточных нейронных сетей // Программные системы: теория и приложения. 2023. Т. 14. № 1. С. 3–30. (Рус., англ.). https://psta.psiras.ru/2023/1_3-30.

Полный текст статьи (PDF): https://psta.psiras.ru/read/psta2023_1_3-30.pdf.

Статья поступила в редакцию 23.11.2022; одобрена после рецензирования 28.11.2022; принята к публикации 12.12.2022; опубликована онлайн 13.02.2023.

© Винокуров И. В.
2023
Адрес редакции: 152021, Ярославская обл., Переславский район, село Веськово, ул. Петра Первого, д. 4а, Институт программных систем имени А. К. Айламазяна РАН; Тел: +7(4852) 695-228 E-mail: ; Сетевой адрес издания:  http://psta.psiras.ru
© Федеральное государственное бюджетное учреждение науки Институт программных систем имени А. К. Айламазяна Российской академии наук (дизайн сайта) 2010–2024 The text of CC-BY-4.0 license