Искусственный интеллект и машинное обучение
Научная статья
Нейросетевая классификация видеороликов по малому числу кадров
Александр Владимирович Смирнов1, Дмитрий Денисович Парфенов2, Игорь Петрович Тищенко3
1,3 | Институт программных систем им. А. К. Айламазяна РАН, Веськово, Россия |
2 | ГУМРФ имени адмирала С.О. Макарова, Санкт-Петербург, Россия |
1 | asmirnov_1991@mail.ru |
Аннотация. В статье предложен метод нейросетевой классификации коротких видеороликов. Задача классификации рассматривается с точки зрения уменьшения числа требуемых операций для категоризации видеороликов. Предлагаемое решение заключается в использовании небольшого числа кадров (не более 10) для выполнения классификации при помощи самой лёгкой нейросетевой архитектуры семейства моделей ResNet. В ходе исследования создан собственный набор данных для обучения, состоящий из трёх классов: «animals», «cars» и «people». В результате получена точность классификации, равная 79%, а также сформирована база данных классифицируемых видеороликов и разработано приложение с элементами GUI для взаимодействия с классификатором и просмотра результатов.
Ключевые слова: Классификация видео, набор данных, нейронные сети, графический интерфейс пользователя
Для цитирования: Смирнов А. В., Парфенов Д. Д., Тищенко И. П. Нейросетевая классификация видеороликов по малому числу кадров // Программные системы: теория и приложения. 2024. Т. 15. № 4. С. 79–96. https://psta.psiras.ru/2024/4_79-96.
Полный текст статьи (PDF): https://psta.psiras.ru/read/psta2024_4_79-96.pdf.
Статья поступила в редакцию 01.10.2024; одобрена после рецензирования 23.10.2024; принята к публикации 04.11.2024; опубликована онлайн 20.11.2024.