Искусственный интеллект и машинное обучение
Научная статья
Метод классификации аспектов аргументации в русскоязычных текстах
Ирина Николаевна Фищева1, Татьяна Анатольевна Пескишева2, Валерия Сергеевна Головизнина3, Евгений Вячеславович Котельников4
Вятский государственный университет, Киров, Россия4 | kotelnikov.ev@gmail.com |
Аннотация. Автоматический анализ аргументации в текстах привлекает в последние годы внимание исследователей в связи с широким диапазоном приложений, в частности, в анализе научных и юридических текстов, новостных статей, политических дебатов, студенческих эссе и социальных медиа. Новая задача в этой области— анализ аргументации с учетом аспектов, где под аспектом понимается свойство объекта, относительно которого строится довод. Учет аспектов позволяет уточнить направленность аргументации и понимание аргументационной структуры, а также может быть использован для генерации высококачественных и специфичных для выбранных аспектов доводов.
В статье предлагается метод классификации аспектов аргументации в текстах на русском языке, построение на его основе и исследование моделей классификации аспектов аргументации с использованием машинного обучения и нейронных сетей. Впервые сформирован русскоязычный текстовый корпус, включающий 1426 предложений и размеченный по 16 аспектам аргументации, построена нейросетевая языковая модель классификации аргументов ArgBERT и обучены модели Random Forest для классификации аспектов аргументации. Качество классификации на основе Random Forest составляет в среднем F1=0,6373. Наилучшее качество разработанные модели демонстрируют для аспектов «Безопасность», «Влияние на здоровье», «Влияние на психику», «Отношение властей» и «Уровень жизни» (F1-мера выше 0,75).
Ключевые слова: анализ аргументации, текстовые корпуса, нейросетевые языковые модели, машинное обучение, Random Forest, аспекты аргументации
Благодарности: Исследование выполнено за счет гранта Российского научного фонда № 22-21-00885
Для цитирования: Фищева И. Н., Пескишева Т. А., Головизнина В. С., Котельников Е. В. Метод классификации аспектов аргументации в русскоязычных текстах // Программные системы: теория и приложения. 2023. Т. 14. № 4. С. 25–45. https://psta.psiras.ru/2023/4_25-45.
Полный текст статьи (PDF): https://psta.psiras.ru/read/psta2023_4_25-45.pdf.
Статья поступила в редакцию 01.07.2023; одобрена после рецензирования 19.07.2023; принята к публикации 20.07.2023; опубликована онлайн 19.10.2023.