Искусственный интеллект и машинное обучение
Научная статья
Мультимодальное предсказание цен акций на примере российского рынка ценных бумаг
Касымхан Юсуфович Хубиев1
, Михаил Евгеньевич Семенов2
1,2 | Университет «Сириус», «Сириус», Россия |
1 |
|
Аннотация. Классические методы прогнозирования цен активов в основном опираются на числовые данные, такие как временные ряды цен, объемы торгов, распределение лимитированных ордеров и индикаторы технического анализа. Однако новостной фон играет существенную роль в формировании цен, что делает актуальным развитие мультимодальных подходов, объединяющих текстовые и числовые данные для повышения точности предсказаний.
В данной работе решается задача прогнозирования цен финансовых активов с использованием мультимодального подхода, объединяющего временные ряды цен и текстовую модальность новостного потока. Для исследований был собран уникальный набор данных, включающий временные ряды для 176 акций российских компаний, торгуемых на Московской бирже, и русскоязычных финансовых новостей.
Для обработки текстовых данных использовались предобученные модели RuBERT и Vikhr-Qwen2.5-0.5b-Instruct (большая языковая модель), временные ряды и векторизованная текстовая модальность обрабатывались рекуррентной нейронной сетью LSTM. В ходе экспериментов сравнивались модели с одной модальностью и двумя модальностями, а также различные методы агрегации векторных представлений текстов.
Качество прогнозов оценивалось по двум ключевым метрикам: точности (accuracy) предсказания направления изменения цены (рост/снижение) и средней абсолютной процентной ошибке (MAPE) отклонения предсказанной цены от истинной. Эксперименты показали, что добавление текстовой модальности позволяет уменьшить значение MAPE на 55%.
Полученный мультимодальный набор данных представляет ценность для дальнейшей адаптации языковых моделей в финансовой сфере. Перспективные направления исследований включают оптимизацию параметров текстовой модальности, таких как временное окно, тональность и хронологический порядок новостных сообщений. (Связанные тексты статьи на английском и на русском языках).
Ключевые слова: мультимодальная предсказательная модель, количественные финансы, машинное обучение
Благодарности: Результаты получены при финансовой поддержке исследования, реализуемого в рамках государственной программы федеральной территории «Сириус» «Научно-технологическое развитие федеральной территории „Сириус“» (Соглашение №18-03 от 10.09.2024)
Для цитирования: Хубиев К. Ю., Семенов М. Е. Мультимодальное предсказание цен акций на примере российского рынка ценных бумаг // Программные системы: теория и приложения. 2025. Т. 16. № 1. С. 83–130. (Англ., Рус.). https://psta.psiras.ru/2025/1_83-130.
Полный текст двуязычной статьи (PDF): https://psta.psiras.ru/read/psta2025_1_83-130.pdf (клик по флажку в верхнем колонитуле переключает язык страницы).
Статья поступила в редакцию 24.12.2024; одобрена после рецензирования 30.01.2025; принята к публикации 27.02.2025; опубликована онлайн 11.03.2025.