Титульная страница Программные системы: теория и приложения  English version
ISSN 2079-3316 Двуязычный электронный научный Электронный научный журнал Института программных систем имени А. К. Айламазяна ИПС им. А. К. Айламазяна ИПС Российской Академии Наук РАН 12+ 
Том 16 (2025) .– Выпуск 6 (71) .– Статья № 5 (452)

Медицинская информатика

Научная статья

Автоматическое распознавание речевых медицинских данных с использованием LLM

Юрий Геннадьевич Сидоров1Переписывавшийся автор, Владимир Леонидович Малых2, Алексей Николаевич Калинин3, Ольга Сергеевна Елистратова4

1,3Группа компаний «Интерин», Москва, Россия
2,4Институт программных систем им. А. К. Айламазяна РАН, Веськово, Россия
1 Юрий Геннадьевич Сидоров — Переписывавшийся автор sidorov@interin.ru

Аннотация. Одним из барьеров, препятствующих широкому распространению голосового ввода медицинских данных в МИС, являются недостаточные потребительские качества текстов, получающихся после транскрибации. Не все медицинские термины и слова общего лексикона распознаются корректно, нарушается согласование слов по роду, числу и падежам, текст недостаточно хорошо форматирован с точки зрения грамматики. Всё это требует дальнейшей доработки текста. Ещё одной сложной проблемой видится необходимость приведения текста к структуре медицинского документа в МИС. Структура документа может быть достаточно сложной, содержать много элементов, иметь требования к типу и формату данных в элементах структуры. Речевой ввод может лишь частично использоваться для формирования документа, а недостающие данные могут быть взяты из пользовательского шаблона.

Для решения указанных проблем предлагается использовать LLM в качестве корректора результатов транскрибации речи, интегратора речевых и текстовых данных из шаблона и формирователя структуры результирующих данных. В работе предлагается архитектура решения для ввода речевых медицинских данных на основе композиции системы транскрибации и LLM. Предлагается методика проведения испытаний решения, включающая подготовку набора данных и метрику расчёта качества решения. Описывается реализация решения на основе свободной и проприетарной компонент.

Результаты могут быть использованы при разработке и оценке систем ИИ, применяемых для ввода речевых данных, и не только в медицине.

Ключевые слова: медицинские информационные системы, МИС, искусственный интеллект, ИИ, речевой ввод, система транскрибации, большие языковые модели, LLM

Благодарности: Авторы искренне благодарны Дмитрию Владимировичу Белышеву за внимание к статье и ценные замечания, позволившие улучшить содержание статьи

Для цитирования: Сидоров Ю. Г., Малых В. Л., Калинин А. Н., Елистратова О. С. Автоматическое распознавание речевых медицинских данных с использованием LLM // Программные системы: теория и приложения. 2025. Т. 16. № 6. С. 197–219. https://psta.psiras.ru/2025/6_197-219.

Полный текст статьи (PDF): https://psta.psiras.ru/read/psta2025_6_197-219.pdf.

Статья поступила в редакцию 22.10.2025; одобрена после рецензирования 30.10.2025; принята к публикации 17.11.2025; опубликована онлайн 15.12.2025.

© Сидоров Ю. Г., Малых В. Л., Калинин А. Н., Елистратова О. С.
2025
Адрес редакции: 152021, Ярославская обл., Переславский район, село Веськово, ул. Петра Первого, д. 4а, Институт программных систем имени А. К. Айламазяна РАН;   Сетевой адрес издания:  http://psta.psiras.ru  Тел: +7(4852) 695-228 ;  E-mail: info@psta.psiras.ru ;  Лицензия: CC-BY-4.0Текст лицензии на сайте Creative Commons 
© Федеральное государственное бюджетное учреждение науки Институт программных систем имени А. К. Айламазяна Российской академии наук (дизайн сайта) 2010–2025