Искусственный интеллект и машинное обучение
Научная статья
ББК 32.813.5: 32.973.202-018.2
ГРНТИ 28.23.15
DOI 10.25209/2079-3316-2023-14-1-3-30
Распознавание табличной информации с использованием свёрточных нейронных сетей
Игорь Викторович Винокуров
Финансовый Университет при Правительстве Российской Федерации, Москва, Россия | |
igvvinokurov@fa.ru |
Аннотация. Показана актуальность выявления табличной информации и распознавания её содержимого для обработки отсканированных документов. Описано формирование набора данных для обучения, валидации и тестирования нейронной сети глубокого обучения (DNN) YOLOv5s для обнаружения простых таблиц. Отмечена эффективность использования этой DNN при работе с отсканированными документами. С использованием Keras Functional API сформирована свёрточная нейронная сеть (CNN) для распознавания основных элементов табличной информации — цифр, основных знаков препинания и букв кириллицы. Приведены результаты исследования работы этой CNN. Описана реализация выявления и распознавания табличной информации на отсканированных документах в разработанной ИС актуализации информации в базах данных системы ЕГРН Росреестра. (Связанные тексты статьи на русском и на английском).
Ключевые слова: Свёрточные нейронные сети, нейронные сети глубокого обучения, CNN, DNN, YOLOv5s, Keras, Python
Для цитирования: Винокуров И. В. Распознавание табличной информации с использованием свёрточных нейронных сетей // Программные системы: теория и приложения. 2023. Т. 14. № 1. С. 3–30. (Рус., англ.). https://psta.psiras.ru/2023/1_3-30.
Полный текст статьи (PDF): https://psta.psiras.ru/read/psta2023_1_3-30.pdf.
Статья поступила в редакцию 23.11.2022; одобрена после рецензирования 28.11.2022; принята к публикации 12.12.2022; опубликована онлайн 13.02.2023.