Медицинская информатика
Научная статья
61: 007.51: 316ББК
51.1: 32.817: 32.973.202-018.2ГРНТИ
50.41.21DOI
Автоматическое распознавание речевых медицинских данных с использованием LLM
Юрий Геннадьевич Сидоров1
, Владимир Леонидович Малых2, Алексей Николаевич Калинин3, Ольга Сергеевна Елистратова4
| 1,3 | Группа компаний «Интерин», Москва, Россия |
| 2,4 | Институт программных систем им. А. К. Айламазяна РАН, Веськово, Россия |
| 1 |
|
Аннотация. Одним из барьеров, препятствующих широкому распространению голосового ввода медицинских данных в МИС, являются недостаточные потребительские качества текстов, получающихся после транскрибации. Не все медицинские термины и слова общего лексикона распознаются корректно, нарушается согласование слов по роду, числу и падежам, текст недостаточно хорошо форматирован с точки зрения грамматики. Всё это требует дальнейшей доработки текста. Ещё одной сложной проблемой видится необходимость приведения текста к структуре медицинского документа в МИС. Структура документа может быть достаточно сложной, содержать много элементов, иметь требования к типу и формату данных в элементах структуры. Речевой ввод может лишь частично использоваться для формирования документа, а недостающие данные могут быть взяты из пользовательского шаблона.
Для решения указанных проблем предлагается использовать LLM в качестве корректора результатов транскрибации речи, интегратора речевых и текстовых данных из шаблона и формирователя структуры результирующих данных. В работе предлагается архитектура решения для ввода речевых медицинских данных на основе композиции системы транскрибации и LLM. Предлагается методика проведения испытаний решения, включающая подготовку набора данных и метрику расчёта качества решения. Описывается реализация решения на основе свободной и проприетарной компонент.
Результаты могут быть использованы при разработке и оценке систем ИИ, применяемых для ввода речевых данных, и не только в медицине.
Ключевые слова: медицинские информационные системы, МИС, искусственный интеллект, ИИ, речевой ввод, система транскрибации, большие языковые модели, LLM
Благодарности: Авторы искренне благодарны Дмитрию Владимировичу Белышеву за внимание к статье и ценные замечания, позволившие улучшить содержание статьи
Для цитирования: Сидоров Ю. Г., Малых В. Л., Калинин А. Н., Елистратова О. С. Автоматическое распознавание речевых медицинских данных с использованием LLM // Программные системы: теория и приложения. 2025. Т. 16. № 6. С. 197–219. https://psta.psiras.ru/2025/6_197-219.
Полный текст статьи (PDF): https://psta.psiras.ru/read/psta2025_6_197-219.pdf.
Статья поступила в редакцию 22.10.2025; одобрена после рецензирования 30.10.2025; принята к публикации 17.11.2025; опубликована онлайн 15.12.2025.