Искусственный интеллект и машинное обучение
Научная статья
Сравнительный анализ состязательных методов для нетематической классификации текстов
Михаил Николаевич Лепехин1
, Сергей Александрович Шаров2
| 1 | Московский физико-технический институт, Москва, Россия |
| 2 | Университет Лидса, Лидс, Великобритания |
| 1 |
|
Аннотация. Нетематическая классификация текстов широко используется в современных приложениях. Одной из проблем, возникающих при решении этой задачи, является наличие смещений в распределении в тренировочных текстовых корпусах. Наиболее существенным видом смещений являются тематические смещения. Для решения этой проблемы в данной работе применяются состязательные методы - Adversarial Domain Adaptation, Energy-based ADA, BERT с контрастной функцией потерь и ADA с контрастной функцией потерь.
В работе впервые производится модификация контрастной функции потерь для снижения влияния тематических сдвигов и показывается, что использование состязательных методов повышает точность и надежность классификаторов для задачи определения пола автора текста. Также проводятся эксперименты с LLaMA-3B и показано, что большие языковые модели достигают в режиме few-shot более низкую точность чем дообученные модели с меньшим числом параметров, и требуют больше времени для предсказания.
Ключевые слова: Состязательные методы, контрастная функция потерь, классификация гендера, классификация текстов, нетематическая классификация, bert, доменная адаптация
Для цитирования: Лепехин М. Н., Шаров С. А. Сравнительный анализ состязательных методов для нетематической классификации текстов // Программные системы: теория и приложения. 2026. Т. 17. № 1. С. 57–84. https://psta.psiras.ru/2026/1_57-84.
Полный текст статьи (PDF): https://psta.psiras.ru/read/psta2026_1_57-84.pdf.
Статья поступила в редакцию 11.12.2025; одобрена после рецензирования 26.01.2026; принята к публикации 12.02.2026; опубликована онлайн 04.03.2026.


