Искусственный интеллект и машинное обучение
Научная статья

ББК

ГРНТИ

DOI
Повышение точности сегментирования объектов с использованием генеративно-состязательной сети
Игорь Викторович Винокуров
Финансовый Университет при Правительстве Российской Федерации, Москва, Россия | |
|
Аннотация. Маски, полученные с использованием модели глубокого обучения Mask R-CNN, в ряде случаев могут содержать фрагментированные контуры, неровные границы, ложные сращивания соседних объектов и участки с пропущенной сегментацией. Чем больше объектов детектирования на изображении и меньше их размер, тем более чаще встречаются различного вида недостатки их масок. Примерами таких изображений могут являться аэрофотоснимки коттеджных и садовых товариществ и кооперативов, характеризующихся высокой плотности застройки. Для коррекции указанных недостатков предлагается использовать модель генеративно-состязательной сети, выполняющую постобработку предсказанных Mask R-CNN масок.
Качественная оценка сформированной в работе модели продемонстрировала, что она способна на приемлемом уровне восстанавливать целостность контуров, заполняет пропущенные области и разделять ошибочно объединенные объекты. Количественный анализ по метрикам IoU, precision, recall и F1-score показал статистически значимое улучшение качества сегментации по сравнению с исходными масками Mask R-CNN. Полученные результаты подтвердили, что предложенный подход позволяет довести точность формирования масок объектов до уровня, удовлетворяющего требованиям их практического применения в системах автоматизированного анализа аэрофотоснимков. (Связанные тексты статьи на английском и на русском языках).
Ключевые слова: Компьютерное зрение, сегментация изображений, маски объектов, генеративно-состязательные сети, Mask R-CNN, PyTorch
Для цитирования: Винокуров И. В. Повышение точности сегментирования объектов с использованием генеративно-состязательной сети // Программные системы: теория и приложения. 2025. Т. 16. № 2. С. 111–152. (Англ., Рус.). https://psta.psiras.ru/2025/2_111-152.
Полный текст двуязычной статьи (PDF): https://psta.psiras.ru/read/psta2025_2_111-152.pdf (клик по флажку в верхнем колонитуле переключит язык страницы).
Статья поступила в редакцию 21.04.2025; одобрена после рецензирования 10.06.2025; принята к публикации 11.06.2025; опубликована онлайн 28.06.2025.