Титульная страница Программные системы: теория и приложения  English version
ISSN 2079-3316 Двуязычный электронный научный Электронный научный журнал Института программных систем имени А. К. Айламазяна ИПС им. А. К. Айламазяна ИПС Российской Академии Наук РАН 12+ 
Том 16 (2025) .– Выпуск 2 (65) .– Статья № 4 (451)

Искусственный интеллект и машинное обучение

Научная статья

Повышение точности сегментирования объектов с использованием генеративно-состязательной сети

Игорь Викторович ВинокуровПереписывавшийся автор

Финансовый Университет при Правительстве Российской Федерации, Москва, Россия
Игорь Викторович Винокуров — Переписывавшийся автор igvvinokurov@fa.ru

Аннотация. Маски, полученные с использованием модели глубокого обучения Mask R-CNN, в ряде случаев могут содержать фрагментированные контуры, неровные границы, ложные сращивания соседних объектов и участки с пропущенной сегментацией. Чем больше объектов детектирования на изображении и меньше их размер, тем более чаще встречаются различного вида недостатки их масок. Примерами таких изображений могут являться аэрофотоснимки коттеджных и садовых товариществ и кооперативов, характеризующихся высокой плотности застройки. Для коррекции указанных недостатков предлагается использовать модель генеративно-состязательной сети, выполняющую постобработку предсказанных Mask R-CNN масок.

Качественная оценка сформированной в работе модели продемонстрировала, что она способна на приемлемом уровне восстанавливать целостность контуров, заполняет пропущенные области и разделять ошибочно объединенные объекты. Количественный анализ по метрикам IoU, precision, recall и F1-score показал статистически значимое улучшение качества сегментации по сравнению с исходными масками Mask R-CNN. Полученные результаты подтвердили, что предложенный подход позволяет довести точность формирования масок объектов до уровня, удовлетворяющего требованиям их практического применения в системах автоматизированного анализа аэрофотоснимков. (Связанные тексты статьи на английском и на русском языках).

Ключевые слова: Компьютерное зрение, сегментация изображений, маски объектов, генеративно-состязательные сети, Mask R-CNN, PyTorch

Для цитирования: Винокуров И. В. Повышение точности сегментирования объектов с использованием генеративно-состязательной сети // Программные системы: теория и приложения. 2025. Т. 16. № 2. С. 111–152. (Англ., Рус.). https://psta.psiras.ru/2025/2_111-152.

Полный текст двуязычной статьи (PDF): https://psta.psiras.ru/read/psta2025_2_111-152.pdf (клик по флажку в верхнем колонитуле переключит язык страницы).

Статья поступила в редакцию 21.04.2025; одобрена после рецензирования 10.06.2025; принята к публикации 11.06.2025; опубликована онлайн 28.06.2025.

© Винокуров И. В.
2025
Адрес редакции: 152021, Ярославская обл., Переславский район, село Веськово, ул. Петра Первого, д. 4а, Институт программных систем имени А. К. Айламазяна РАН;   Сетевой адрес издания:  http://psta.psiras.ru  Тел: +7(4852) 695-228 ;  E-mail: info@psta.psiras.ru ;  Лицензия: CC-BY-4.0Текст лицензии на сайте Creative Commons 
© Федеральное государственное бюджетное учреждение науки Институт программных систем имени А. К. Айламазяна Российской академии наук (дизайн сайта) 2010–2025