Титульная страница Программные системы: теория и приложения  English version
ISSN 2079-3316 Двуязычный электронный научный Электронный научный журнал Института программных систем имени А. К. Айламазяна ИПС им. А. К. Айламазяна ИПС Российской Академии Наук РАН 12+ 
Том 14 (2023) .– Выпуск 1 (56) .– Статья № 1 (422)

Искусственный интеллект и машинное обучение

Научная статья

Распознавание табличной информации с использованием свёрточных нейронных сетей

Игорь Викторович ВинокуровПереписывавшийся автор

Финансовый Университет при Правительстве Российской Федерации, Москва, Россия
Игорь Викторович Винокуров — Переписывавшийся автор igvvinokurov@fa.ru

Аннотация. Показана актуальность выявления табличной информации и распознавания её содержимого для обработки отсканированных документов. Описано формирование набора данных для обучения, валидации и тестирования нейронной сети глубокого обучения (DNN) YOLOv5s для обнаружения простых таблиц. Отмечена эффективность использования этой DNN при работе с отсканированными документами. С использованием Keras Functional API сформирована свёрточная нейронная сеть (CNN) для распознавания основных элементов табличной информации — цифр, основных знаков препинания и букв кириллицы. Приведены результаты исследования работы этой CNN. Описана реализация выявления и распознавания табличной информации на отсканированных документах в разработанной ИС актуализации информации в базах данных системы ЕГРН Росреестра. (Связанные тексты статьи на русском и на английском).

Ключевые слова: Свёрточные нейронные сети, нейронные сети глубокого обучения, CNN, DNN, YOLOv5s, Keras, Python

Для цитирования: Винокуров И. В. Распознавание табличной информации с использованием свёрточных нейронных сетей // Программные системы: теория и приложения. 2023. Т. 14. № 1. С. 3–30. (Рус., англ.). https://psta.psiras.ru/2023/1_3-30.

Полный текст статьи (PDF): https://psta.psiras.ru/read/psta2023_1_3-30.pdf.

Статья поступила в редакцию 23.11.2022; одобрена после рецензирования 28.11.2022; принята к публикации 12.12.2022; опубликована онлайн 13.02.2023.

© Винокуров И. В.
2023
Адрес редакции: 152021, Ярославская обл., Переславский район, село Веськово, ул. Петра Первого, д. 4а, Институт программных систем имени А. К. Айламазяна РАН;   Сетевой адрес издания:  http://psta.psiras.ru  Тел: +7(4852) 695-228 ;  E-mail: info@psta.psiras.ru ;  Лицензия: CC-BY-4.0Текст лицензии на сайте Creative Commons 
© Федеральное государственное бюджетное учреждение науки Институт программных систем имени А. К. Айламазяна Российской академии наук (дизайн сайта) 2010–2025