Использование многоуровневых источников данных для подготовки обучающих наборов для обнаружения кибератак

Сергей В. Исаев; Дмитрий Д. Кононов

Программные системы: теория и приложения

ISSN 2079-3316

Двуязычный электронный научный Электронный научный журнал Института программных систем имени А. К. Айламазяна ИПС им. А. К. Айламазяна ИПС Российской Академии Наук РАН

12+

Том 16 (2025) .– Выпуск 4 (67) .– Статья № 10 (457)

Программное и аппаратное обеспечение распределенных и суперкомпьютерных систем

Научная статья

УДК

004.89+004.056 УДК 004: Информационные технологии. Компьютерные технологии. Теория вычислительных машин и систем
УДК 004.89: Прикладные системы искусственного интеллекта. Интеллектуальные системы, обладающие знаниями
УДК 004.056: Безопасность, защищённость данных

УДК 004: Информационные технологии. Компьютерные технологии. Теория вычислительных машин и систем
УДК 004.89: Прикладные системы искусственного интеллекта. Интеллектуальные системы, обладающие знаниями
УДК 004.056: Безопасность, защищённость данных

ББК

Библиотечно-библиографическая классификация

32.972.1

ГРНТИ

Государственный рубрикатор научно-технической информации

49.33.35

DOI

10.25209/2079-3316-2025-16-4-267-285

Использование многоуровневых источников данных для подготовки обучающих наборов для обнаружения кибератак

Дмитрий Дмитриевич Кононов¹, Сергей Владиславович Исаев²

^1,2	Институт вычислительного моделирования СО РАН, Красноярск, Россия
¹	ddk@icm.krasn.ru

Аннотация. Анализ сетевого трафика является неотъемлемой частью обеспечения безопасности в информационно-телекоммуникационных системах. Использование машинного обучения обеспечивает современным подходам более высокие показатели обнаружения киберугроз.

Предлагается новый подход для формирования обучающих наборов данных, который вводит новую единицу агрегации «сеанс», использует сигнатурный анализ и многоуровневые разнородные источники данных. Сформирован список требований к наборам данных, включающий сохранение первых пакетов соединения, сохранение скрытых областей пакетов, расширенную информацию об источниках трафика (страна, номер автономной системы ASN, тип сети). Дополнительная информация нацелена на выявление атак типа «скрытый канал связи». С использованием предложенного подхода разработан программный комплекс для создания обучающих наборов данных из многоуровневых источников на уровнях L7, L4, L3 модели OSI. В отличие от известных работ, используются реальные данные сетевой активности, а также длительные временные интервалы. Предложенный подход позволяет использовать полученные обучающие наборы для создания более эффективных методов обнаружения и предотвращения вторжения с помощью методов машинного обучения.

Ключевые слова: Интернет, сетевая безопасность, киберугрозы, анализ сетевого трафика, наборы данных, машинное обучение

Для цитирования: Кононов Д. Д., Исаев С. В. Использование многоуровневых источников данных для подготовки обучающих наборов для обнаружения кибератак // Программные системы: теория и приложения. 2025. Т. 16. № 4. С. 267–285. https://psta.psiras.ru/2025/4_267-285.

Полный текст статьи (PDF): https://psta.psiras.ru/read/psta2025_4_267-285.pdf.

Статья поступила в редакцию 10.07.2025; одобрена после рецензирования 16.07.2025; принята к публикации 03.10.2025; опубликована онлайн 27.11.2025.

2025

Адрес редакции: 152021, Ярославская обл., Переславский район, село Веськово, ул. Петра Первого, д. 4а, Институт программных систем имени А. К. Айламазяна РАН; Сетевой адрес издания: http://psta.psiras.ru

Тел: +7(4852) 695-228 ; E-mail: info@psta.psiras.ru ; Лицензия: CC-BY-4.0 Текст лицензии на сайте Creative Commons

Программное и аппаратное обеспечение распределенных и суперкомпьютерных систем

Научная статья

Использование многоуровневых источников данных для подготовки обучающих наборов для обнаружения кибератак

Дмитрий Дмитриевич Кононов1, Сергей Владиславович Исаев2

Дмитрий Дмитриевич Кононов¹, Сергей Владиславович Исаев²