Искусственный интеллект и машинное обучение
Научная статья
004.932.75'1, 004.89ББК
32.813.5: 32.973.202-018ГРНТИ
28.23.15DOI
Эмбеддинг-ориентированная сегментация объектов с использованием модифицированной U-Net архитектуры
Игорь Викторович Винокуров
| Финансовый Университет при Правительстве Российской Федерации, Москва, Россия | |
|
|
Аннотация. В статье представлена многозадачная нейронная сеть на основе модифицированной архитектуры U-Net для совместной семантической и инстанс-сегментации объектов на аэрофотоснимках. Модель использует симметричный энкодер-декодер с skip-коннекторами и оснащена двумя параллельными выходными головами. Семантическая голова выполняет пиксельную классификацию, а эмбеддинговая генерирует дискриминативные векторные представления для каждого пикселя. Применение специализированной дискриминативной функции потерь обеспечивает компактность кластеров эмбеддингов внутри объектов и их разделение между разными экземплярами. На этапе постобработки кластеризация эмбеддингового поля позволяет однозначно выделить маски отдельных объектов.
Эксперименты проводились на специализированном датасете аэрофотоснимков, содержащем 23 076 размеченных объектов пяти классов. Для ключевого класса «Building» на валидационной выборке достигнуты значения IoU = 0.812 и F1-score = 0.880. Сравнение с современными методами (Mask2Former, OneFormer, SAM 2 с LoRA-адаптацией, MR-DeepLabv3 ) подтверждает конкурентоспособность модели по балансу точности и скорости инференса.
Модель демонстрирует эффективность для задач автоматического картографирования и анализа застройки по данным дистанционного зондирования. (Связанные тексты статьи на английском и на русском языках).
Ключевые слова: семантическая сегментация, инстанс-сегментация, U-Net, эмбеддинги пикселей, дискриминативная функция потерь
Для цитирования: Винокуров И. В. Эмбеддинг-ориентированная сегментация объектов с использованием модифицированной U-Net архитектуры // Программные системы: теория и приложения. 2026. Т. 17. № 1. С. 105–172. (Англ., Рус.). https://psta.psiras.ru/2026/1_105-172.
Полный текст двуязычной статьи (PDF): https://psta.psiras.ru/read/psta2026_1_105-172.pdf (клик по флажку в верхнем колонитуле переключит язык страницы).
Русскоязычная часть оригинальной двуязычной статьи (PDF): https://psta.psiras.ru/read/psta2026_1_105-172-ru.pdf.
Статья поступила в редакцию 06.01.2026; одобрена после рецензирования 16.01.2026; принята к публикации 26.02.2026; опубликована онлайн 12.03.2026.