Титульная страница Программные системы: теория и приложения  English version
ISSN 2079-3316 Двуязычный электронный научный Электронный научный журнал Института программных систем имени А. К. Айламазяна ИПС им. А. К. Айламазяна ИПС Российской Академии Наук РАН 12+ 
Том 17 (2026) .– Выпуск 1 (70) .– Статья № 5 (507)

Искусственный интеллект и машинное обучение

Научная статья

Эмбеддинг-ориентированная сегментация объектов с использованием модифицированной U-Net архитектуры

Игорь Викторович ВинокуровПереписывавшийся автор

Финансовый Университет при Правительстве Российской Федерации, Москва, Россия
Игорь Викторович Винокуров — Переписывавшийся автор igvvinokurov@fa.ru

Аннотация. В статье представлена многозадачная нейронная сеть на основе модифицированной архитектуры U-Net для совместной семантической и инстанс-сегментации объектов на аэрофотоснимках. Модель использует симметричный энкодер-декодер с skip-коннекторами и оснащена двумя параллельными выходными головами. Семантическая голова выполняет пиксельную классификацию, а эмбеддинговая генерирует дискриминативные векторные представления для каждого пикселя. Применение специализированной дискриминативной функции потерь обеспечивает компактность кластеров эмбеддингов внутри объектов и их разделение между разными экземплярами. На этапе постобработки кластеризация эмбеддингового поля позволяет однозначно выделить маски отдельных объектов.

Эксперименты проводились на специализированном датасете аэрофотоснимков, содержащем 23 076 размеченных объектов пяти классов. Для ключевого класса «Building» на валидационной выборке достигнуты значения IoU = 0.812 и F1-score = 0.880. Сравнение с современными методами (Mask2Former, OneFormer, SAM 2 с LoRA-адаптацией, MR-DeepLabv3+^+ ) подтверждает конкурентоспособность модели по балансу точности и скорости инференса.

Модель демонстрирует эффективность для задач автоматического картографирования и анализа застройки по данным дистанционного зондирования. (Связанные тексты статьи на английском и на русском языках).

Ключевые слова: семантическая сегментация, инстанс-сегментация, U-Net, эмбеддинги пикселей, дискриминативная функция потерь

Для цитирования: Винокуров И. В. Эмбеддинг-ориентированная сегментация объектов с использованием модифицированной U-Net архитектуры // Программные системы: теория и приложения. 2026. Т. 17. № 1. С. 105–172. (Англ., Рус.). https://psta.psiras.ru/2026/1_105-172.

Полный текст двуязычной статьи (PDF): https://psta.psiras.ru/read/psta2026_1_105-172.pdf (клик по флажку в верхнем колонитуле переключит язык страницы).

Русскоязычная часть оригинальной двуязычной статьи (PDF): https://psta.psiras.ru/read/psta2026_1_105-172-ru.pdf.

Статья поступила в редакцию 06.01.2026; одобрена после рецензирования 16.01.2026; принята к публикации 26.02.2026; опубликована онлайн 12.03.2026.

© Винокуров И. В.
2026
Адрес редакции: 152021, Ярославская обл., Переславский район, село Веськово, ул. Петра Первого, д. 4а, Институт программных систем имени А. К. Айламазяна РАН;   Сетевой адрес издания:  http://psta.psiras.ru  Тел: +7(4852) 695-228 ;  E-mail: info@psta.psiras.ru ;  Лицензия: CC-BY-4.0Текст лицензии на сайте Creative Commons 
© Федеральное государственное бюджетное учреждение науки Институт программных систем имени А. К. Айламазяна Российской академии наук (дизайн сайта) 2010–2026