Том 14 (2023) .– Выпуск 4 (59) .– Статья № 2 (428)

Искусственный интеллект и машинное обучение

Научная статья

Метод классификации аспектов аргументации в русскоязычных текстах

Ирина Николаевна Фищева1, Татьяна Анатольевна Пескишева2, Валерия Сергеевна Головизнина3, Евгений Вячеславович Котельников4Переписывавшийся автор

Вятский государственный университет, Киров, Россия
4 Евгений Вячеславович Котельников — Переписывавшийся автор kotelnikov.ev@gmail.com

Аннотация. Автоматический анализ аргументации в текстах привлекает в последние годы внимание исследователей в связи с широким диапазоном приложений, в частности, в анализе научных и юридических текстов, новостных статей, политических дебатов, студенческих эссе и социальных медиа. Новая задача в этой области— анализ аргументации с учетом аспектов, где под аспектом понимается свойство объекта, относительно которого строится довод. Учет аспектов позволяет уточнить направленность аргументации и понимание аргументационной структуры, а также может быть использован для генерации высококачественных и специфичных для выбранных аспектов доводов.

В статье предлагается метод классификации аспектов аргументации в текстах на русском языке, построение на его основе и исследование моделей классификации аспектов аргументации с использованием машинного обучения и нейронных сетей. Впервые сформирован русскоязычный текстовый корпус, включающий 1426 предложений и размеченный по 16 аспектам аргументации, построена нейросетевая языковая модель классификации аргументов ArgBERT и обучены модели Random Forest для классификации аспектов аргументации. Качество классификации на основе Random Forest составляет в среднем F1=0,6373. Наилучшее качество разработанные модели демонстрируют для аспектов «Безопасность», «Влияние на здоровье», «Влияние на психику», «Отношение властей» и «Уровень жизни» (F1-мера выше 0,75).

Ключевые слова: анализ аргументации, текстовые корпуса, нейросетевые языковые модели, машинное обучение, Random Forest, аспекты аргументации

Благодарности: Исследование выполнено за счет гранта Российского научного фонда № 22-21-00885

Для цитирования: Фищева И. Н., Пескишева Т. А., Головизнина В. С., Котельников Е. В. Метод классификации аспектов аргументации в русскоязычных текстах // Программные системы: теория и приложения. 2023. Т. 14. № 4. С. 25–45. https://psta.psiras.ru/2023/4_25-45.

Полный текст статьи (PDF): https://psta.psiras.ru/read/psta2023_4_25-45.pdf.

Статья поступила в редакцию 01.07.2023; одобрена после рецензирования 19.07.2023; принята к публикации 20.07.2023; опубликована онлайн 19.10.2023.

© Фищева И. Н., Пескишева Т. А., Головизнина В. С., Котельников Е. В.
2023
Адрес редакции: 152021, Ярославская обл., Переславский район, село Веськово, ул. Петра Первого, д. 4а, Институт программных систем имени А. К. Айламазяна РАН; Тел: +7(4852) 695-228 E-mail: ; Сетевой адрес издания:  http://psta.psiras.ru
© Федеральное государственное бюджетное учреждение науки Институт программных систем имени А. К. Айламазяна Российской академии наук (дизайн сайта) 2010–2024 The text of CC-BY-4.0 license