Медицинская информатика
Научная статья
Извлечение симптомов и автоматическое предсказание диагноза по медицинским клиническим записям
Юрий Петрович Сердюк1, Наталья Александровна Власова2, Седа Рубеновна Момот3
1-3 | Институт программных систем им. А. К. Айламазяна РАН, Веськово, Россия |
1 | Yuri@serdyuk.botik.ru |
Аннотация. В статье представлена система, которая извлекает симптомы заболеваний из медицинских клинических записей (текстов на естественном русском языке) и автоматически предсказывает по ним диагноз в виде наименования заболевания и его кода в соответствии со справочником МКБ-10. Система ограничена предметной областью из 6 пульмонологических заболеваний (хроническая обструктивная болезнь легких, пневмония, бронхиальная астма и др.) и COVID-19.
Извлечение симптомов реализовано с помощью нескольких нейронных сетей, выделяющих отдельные медицинские сущности и связи между ними. Предсказание диагноза также реализовано в виде классификатора на основе нейронной сети. Для обучения извлечению симптомов создан аннотированный корпус предложений. Описаны принципы и правила разметки симптомов. Представлен корпус текстов для обучения классификатора предсказанию диагнозов.
Приведены оценки точности при тестировании обеих подсистем. Точность предсказания диагноза на данной предметной области составила 88,5%. Даны сравнения с аналогичными работами по извлечению симптомов из текстов на различных языках, а также по автоматическому предсказанию диагнозов, включая системы типа ChatGPT.
Ключевые слова: системы поддержки принятия врачебных решений, извлечение симптомов, автоматическое предсказание диагнозов, BERT-модели, системы на основе ChatGPT.
Для цитирования: Сердюк Ю. П., Власова Н. А., Момот С. Р. Извлечение симптомов и автоматическое предсказание диагноза по медицинским клиническим записям // Программные системы: теория и приложения. 2024. Т. 15. № 4. С. 153–181. https://psta.psiras.ru/2024/4_153-181.
Полный текст статьи (PDF): https://psta.psiras.ru/read/psta2024_4_153-181.pdf.
Статья поступила в редакцию 03.12.2024; одобрена после рецензирования 27.12.2024; принята к публикации 28.12.2024; опубликована онлайн 28.12.2024.