Титульная страница Программные системы: теория и приложения  English version
ISSN 2079-3316 Двуязычный электронный научный Электронный научный журнал Института программных систем имени А. К. Айламазяна ИПС им. А. К. Айламазяна ИПС Российской Академии Наук РАН 12+ 
Том 16 (2025) .– Выпуск 4 (67) .– Статья № 10 (457)

Программное и аппаратное обеспечение распределенных и суперкомпьютерных систем

Научная статья

Использование многоуровневых источников данных для подготовки обучающих наборов для обнаружения кибератак

Дмитрий Дмитриевич Кононов1Переписывавшийся автор, Сергей Владиславович Исаев2

1,2Институт вычислительного моделирования СО РАН, Красноярск, Россия
1 Дмитрий Дмитриевич Кононов — Переписывавшийся автор ddk@icm.krasn.ru

Аннотация. Анализ сетевого трафика является неотъемлемой частью обеспечения безопасности в информационно-телекоммуникационных системах. Использование машинного обучения обеспечивает современным подходам более высокие показатели обнаружения киберугроз.

Предлагается новый подход для формирования обучающих наборов данных, который вводит новую единицу агрегации «сеанс», использует сигнатурный анализ и многоуровневые разнородные источники данных. Сформирован список требований к наборам данных, включающий сохранение первых пакетов соединения, сохранение скрытых областей пакетов, расширенную информацию об источниках трафика (страна, номер автономной системы ASN, тип сети). Дополнительная информация нацелена на выявление атак типа «скрытый канал связи». С использованием предложенного подхода разработан программный комплекс для создания обучающих наборов данных из многоуровневых источников на уровнях L7, L4, L3 модели OSI. В отличие от известных работ, используются реальные данные сетевой активности, а также длительные временные интервалы. Предложенный подход позволяет использовать полученные обучающие наборы для создания более эффективных методов обнаружения и предотвращения вторжения с помощью методов машинного обучения.

Ключевые слова: Интернет, сетевая безопасность, киберугрозы, анализ сетевого трафика, наборы данных, машинное обучение

Для цитирования: Кононов Д. Д., Исаев С. В. Использование многоуровневых источников данных для подготовки обучающих наборов для обнаружения кибератак // Программные системы: теория и приложения. 2025. Т. 16. № 4. С. 267–285. https://psta.psiras.ru/2025/4_267-285.

Полный текст статьи (PDF): https://psta.psiras.ru/read/psta2025_4_267-285.pdf.

Статья поступила в редакцию 10.07.2025; одобрена после рецензирования 16.07.2025; принята к публикации 03.10.2025; опубликована онлайн 27.11.2025.

© Кононов Д. Д., Исаев С. В.
2025
Адрес редакции: 152021, Ярославская обл., Переславский район, село Веськово, ул. Петра Первого, д. 4а, Институт программных систем имени А. К. Айламазяна РАН;   Сетевой адрес издания:  http://psta.psiras.ru  Тел: +7(4852) 695-228 ;  E-mail: info@psta.psiras.ru ;  Лицензия: CC-BY-4.0Текст лицензии на сайте Creative Commons 
© Федеральное государственное бюджетное учреждение науки Институт программных систем имени А. К. Айламазяна Российской академии наук (дизайн сайта) 2010–2025