Титульная страница Программные системы: теория и приложения  English version
ISSN 2079-3316 Двуязычный электронный научный Электронный научный журнал Института программных систем имени А. К. Айламазяна ИПС им. А. К. Айламазяна ИПС Российской Академии Наук РАН 12+ 
Том 16 (2025) .– Выпуск 1 (64) .– Статья № 4 (446)

Искусственный интеллект и машинное обучение

Научная статья

Мультимодальное предсказание цен акций на примере российского рынка ценных бумаг

Касымхан Юсуфович Хубиев1Переписывавшийся автор, Михаил Евгеньевич Семенов2

1,2Университет «Сириус», «Сириус», Россия
1 Касымхан Юсуфович Хубиев — Переписывавшийся автор kasymkhankhubievnis@gmail.com

Аннотация. Классические методы прогнозирования цен активов в основном опираются на числовые данные, такие как временные ряды цен, объемы торгов, распределение лимитированных ордеров и индикаторы технического анализа. Однако новостной фон играет существенную роль в формировании цен, что делает актуальным развитие мультимодальных подходов, объединяющих текстовые и числовые данные для повышения точности предсказаний.

В данной работе решается задача прогнозирования цен финансовых активов с использованием мультимодального подхода, объединяющего временные ряды цен и текстовую модальность новостного потока. Для исследований был собран уникальный набор данных, включающий временные ряды для 176 акций российских компаний, торгуемых на Московской бирже, и 7955579555 русскоязычных финансовых новостей.

Для обработки текстовых данных использовались предобученные модели RuBERT и Vikhr-Qwen2.5-0.5b-Instruct (большая языковая модель), временные ряды и векторизованная текстовая модальность обрабатывались рекуррентной нейронной сетью LSTM. В ходе экспериментов сравнивались модели с одной модальностью и двумя модальностями, а также различные методы агрегации векторных представлений текстов.

Качество прогнозов оценивалось по двум ключевым метрикам: точности (accuracy) предсказания направления изменения цены (рост/снижение) и средней абсолютной процентной ошибке (MAPE) отклонения предсказанной цены от истинной. Эксперименты показали, что добавление текстовой модальности позволяет уменьшить значение MAPE на 55%.

Полученный мультимодальный набор данных представляет ценность для дальнейшей адаптации языковых моделей в финансовой сфере. Перспективные направления исследований включают оптимизацию параметров текстовой модальности, таких как временное окно, тональность и хронологический порядок новостных сообщений. (Связанные тексты статьи на английском и на русском языках).

Ключевые слова: мультимодальная предсказательная модель, количественные финансы, машинное обучение

Благодарности: Результаты получены при финансовой поддержке исследования, реализуемого в рамках государственной программы федеральной территории «Сириус» «Научно-технологическое развитие федеральной территории „Сириус“» (Соглашение №18-03 от 10.09.2024)

Для цитирования: Хубиев К. Ю., Семенов М. Е. Мультимодальное предсказание цен акций на примере российского рынка ценных бумаг // Программные системы: теория и приложения. 2025. Т. 16. № 1. С. 83–130. (Англ., Рус.). https://psta.psiras.ru/2025/1_83-130.

Полный текст двуязычной статьи (PDF): https://psta.psiras.ru/read/psta2025_1_83-130.pdf (клик по флажку в верхнем колонитуле переключает язык страницы).

Статья поступила в редакцию 24.12.2024; одобрена после рецензирования 30.01.2025; принята к публикации 27.02.2025; опубликована онлайн 11.03.2025.

© Хубиев К. Ю., Семенов М. Е.
2025
Адрес редакции: 152021, Ярославская обл., Переславский район, село Веськово, ул. Петра Первого, д. 4а, Институт программных систем имени А. К. Айламазяна РАН;   Сетевой адрес издания:  http://psta.psiras.ru Тел: +7(4852) 695-228;   E-mail: ;   Лицензия: CC-BY-4.0Текст лицензии на сайте Creative Commons
© Федеральное государственное бюджетное учреждение науки Институт программных систем имени А. К. Айламазяна Российской академии наук (дизайн сайта) 2010–2025