Доц. Стоян Михов, който е доктор на науките в Института по информационни и комуникационни технологии на БАН, ще представи нова система по време на уебинар, в който акцент е поставен върху етапните резултати от работата по Националната научна програма „Електронно здравеопазване в България” (е-здраве), създадена в изпълнение на Националната стратегия за развитие на научните изследвания 2030 и финансирана от МОН.
Става въпрос за компютърна система, която да позволи на медицинските специалисти по време или след медицински преглед или манипулация да диктуват на глас съответна анамнеза, статус, епикриза или друг медицински документ.
„Системата преобразува автоматично речта, която се диктува, в електронен текст. По този начин се избягва необходимостта от въвеждането на съответната медицинска документация през клавиатурата. Така може да се ускори процесът на изготвянето на медицинските документи, както и да се повиши качеството им”, казва доц. Стоян Михов, който е ръководител на работен пакет от ННП е-Здраве, чиято задача е да реализира и имплементира прототип за компютърно подпомагане на изготвянето на медицинска документация.
Най-голям ефект се предвижда да се получи при специалности, при които по време на процедурите специалистите са ангажирани с други дейности — например в областта на образната диагностика, патология, хирургия и др. В последващ етап е възможно интегрирането на системата в действащите медицински информационни системи, с което още повече да се намали необходимостта от работата с мишка и клавиатура.
„В момента завършваме втората година на проекта. На този етап продуктът е на ниво втора версия на прототип. През третата година на ННП еЗдраве се предвижда да се реализира и тества интеграция на диктофона към действащи медицински информационни системи”, поясни още доц. Михов.
По думите му, в неговата група има множество научни резултати в областта на обработката на реч, които са публикувани и докладвани на редица научни форуми в областта.
„По-конкретно имаме резултати за методите за представянето на езикови модели и тяхното прилагане за целите на разпознаването на реч. Друг основен ресурс, който създадохме преди началото на ННП еЗдраве, е съставянето на специализиран корпус от записи със съответни транскрипции за целите на обучение на акустичен модел за разпознаване на реч”, съобщи още докторът на науките в Института по информационни и комуникационни технологии на БАН.
За целта са обработили над 2000 часа записи от пленарните заседания на Народното събрание. От тях са извлекли общо около 300 часа от 570 различни диктори. Записите са сегментирани на около 150000 изказа, всеки от които е в отделен файл и подравнен със съответна транскрипция.
На тази база екипът на доцента е построил система за разпознаване на българска реч, която върху парламентарни записи постига 93% прецизност.
„Всички записи на медицински документи са диктувани от медицински специалисти от МУ-Пловдив, МУ-Плевен и Тракийски университет Стара Загора. Разполагаме с обработени 26 часа записи от 51 медицински специалисти. В почти всички случаи записът е диктовка на вече наличен текст, който ни е предоставен заедно със записа от диктора”, казва още доц. Стоян Михов.
В момента се завършва втората версия на прототипа на диктофона.
„Във втората версия значително увеличихме речниковия фонд на системата и създадохме езиков модел на базата на корпус от реални псевдонимизирани медицински документи с обем около половин милиард думи. По този начин успяхме значително да намалим грешките при разпознаването на речта, което пести времето и повишава удобството за ползвателите. В момента успяхме да постигнем прецизност на ниво думи върху записи на медицински документи над 90%”, отбеляза доцентът.
Диктофонът ще може да бъде използван от всички медицински специалисти, но поради сложността няма как да бъде обхваната цялата медицинската терминология във всички специалности. Засега е обхваната по-пълно терминологията, използвана от личните лекари и специалистите по белодробни заболявания. В бъдеще ще може да се специализира диктофонът за други медицински специалности.
„Надяваме се обучението за работа с диктофона да не отнема повече от няколко часа. Всъщност предполагаме, че хората с опит с компютърните технологии няма да имат нужда от специално обучение”, каза още доц. Стоян Михов.
ННП еЗдраве завършва в края на 2021 година. Тогава се планира завършеният вариант на прототипа на диктофона с готовност за интеграция в медицински информационни системи. Кога и по какъв начин системата ще бъде интегрирана в действащите медицински информационни системи, ще зависи от фирмите производители на системите.
Стоян Михов е доцент, доктор на науките в Института по информационни и комуникационни технологии на БАН. Той отговаря за лабораторията за обработка на реч на института, където ръководи развитието на речевите технологии за български език. Също така е научен консултант и преподавател към магистърската програма по компютърна лингвистика във Факултета по математика и информатика на Софийския университет "Св. Климент Охридски".
Доцент Михов е член на множество програмни комитети и чест докладчик на международни конференции в областта на крайните автомати и обработката на естествен език и е участвал в редица съвместни европейски изследователски проекти.