Программное и аппаратное обеспечение распределенных и суперкомпьютерных систем
Научная статья
Использование многоуровневых источников данных для подготовки обучающих наборов для обнаружения кибератак
Дмитрий Дмитриевич Кононов1
, Сергей Владиславович Исаев2
| 1,2 | Институт вычислительного моделирования СО РАН, Красноярск, Россия |
| 1 |
|
Аннотация. Анализ сетевого трафика является неотъемлемой частью обеспечения безопасности в информационно-телекоммуникационных системах. Использование машинного обучения обеспечивает современным подходам более высокие показатели обнаружения киберугроз.
Предлагается новый подход для формирования обучающих наборов данных, который вводит новую единицу агрегации «сеанс», использует сигнатурный анализ и многоуровневые разнородные источники данных. Сформирован список требований к наборам данных, включающий сохранение первых пакетов соединения, сохранение скрытых областей пакетов, расширенную информацию об источниках трафика (страна, номер автономной системы ASN, тип сети). Дополнительная информация нацелена на выявление атак типа «скрытый канал связи». С использованием предложенного подхода разработан программный комплекс для создания обучающих наборов данных из многоуровневых источников на уровнях L7, L4, L3 модели OSI. В отличие от известных работ, используются реальные данные сетевой активности, а также длительные временные интервалы. Предложенный подход позволяет использовать полученные обучающие наборы для создания более эффективных методов обнаружения и предотвращения вторжения с помощью методов машинного обучения.
Ключевые слова: Интернет, сетевая безопасность, киберугрозы, анализ сетевого трафика, наборы данных, машинное обучение
Для цитирования: Кононов Д. Д., Исаев С. В. Использование многоуровневых источников данных для подготовки обучающих наборов для обнаружения кибератак // Программные системы: теория и приложения. 2025. Т. 16. № 4. С. 267–285. https://psta.psiras.ru/2025/4_267-285.
Полный текст статьи (PDF): https://psta.psiras.ru/read/psta2025_4_267-285.pdf.
Статья поступила в редакцию 10.07.2025; одобрена после рецензирования 16.07.2025; принята к публикации 03.10.2025; опубликована онлайн 27.11.2025.


