Том 15 (2024) .– Выпуск 3 (62) .– Статья № 4 (451)

Прикладные программные системы

Научная статья

Восстановление текстовых последовательностей с использованием моделей глубокого обучения

Игорь Викторович ВинокуровПереписывавшийся автор

Финансовый Университет при Правительстве Российской Федерации, Москва, Россия
Игорь Викторович Винокуров — Переписывавшийся автор igvvinokurov@fa.ru

Аннотация. В статье приведены результаты формирования, обучения и оценки качества работы моделей с архитектурами Encoder-Decoder и Sequence-To-Sequence (Seq2Seq) для решения задачи дополнения неполных текстов. Задачи такого типа достаточно часто возникают при восстановлении содержимого документов по их некачественным изображениям. Проведённые в работе исследования ориентированы на решение практической задачи формирования электронных копий отсканированных документов ППК «Роскадастр», распознавание которых стандартными средствами затруднительно или невозможно.

Формирование и исследование моделей осуществлялось на языке Python с использованием высокоуровневого API пакета Keras. С целью обучения и исследования моделей был сформирован набор данных, состоящий из нескольких тысяч пар. Каждая пара этого набора представляла собой неполный и соответствующий ему полный тексты. Для оценки качества работы моделей осуществлялось вычисление значений функции потерь loss и метрик accuracy, BLEU и ROUGE-L. Loss и accuracy позволили оценить эффективность моделей на уровне предсказания отдельных слов. Метрики BLEU и ROUGE-L использовались для оценки сходства между полными и восстановленными текстами. Полученные результаты показали, что обе модели Encoder-Decoder и Seq2Seq справляются с задачей восстановления текстовых последовательностей из их фиксированного множества, однако модель на основе трансформера Seq2Seq позволяет достичь лучших результатов по скорости и качеству обучения. (Связанные тексты статьи на русском и на английском языках).

Ключевые слова: модели глубокого обучения, Encoder-Decoder, трансформер Sequence-To-Sequence, восстановление текста, BLEU, ROUGE-L, Keras, Python

Для цитирования: Винокуров И. В. Восстановление текстовых последовательностей с использованием моделей глубокого обучения // Программные системы: теория и приложения. 2024. Т. 15. № 3. С. 75–110. (Рус., англ.). https://psta.psiras.ru/2024/3_75-110.

Полный текст двуязычной статьи (PDF): https://psta.psiras.ru/read/psta2024_3_75-110.pdf (клик по флажку в верхнем колонитуле переключает язык страницы).

Статья поступила в редакцию 03.03.2024; одобрена после рецензирования 14.04.2024; принята к публикации 15.08.2024; опубликована онлайн 23.09.2024.

© Винокуров И. В.
2024
Адрес редакции: 152021, Ярославская обл., Переславский район, село Веськово, ул. Петра Первого, д. 4а, Институт программных систем имени А. К. Айламазяна РАН; Тел: +7(4852) 695-228 E-mail: ; Сетевой адрес издания:  http://psta.psiras.ru
© Федеральное государственное бюджетное учреждение науки Институт программных систем имени А. К. Айламазяна Российской академии наук (дизайн сайта) 2010–2024 The text of CC-BY-4.0 license