Vizuālajā diagnostikā Latvijā tiek izmantotas mūsdienīgas medicīnas tehnoloģijas, taču izmeklējumu aprakstu sagatavošana joprojām notiek pilnībā manuāli. Lielākās ārstniecības iestādes aprakstu sagatavošanai – ārstu veikto izmeklējumu audioierakstu transkribēšanai – izmanto diktofonu centrus. Piemēram, RAKUS dienā vidēji tiek sagatavoti vairāk nekā 100 vizuālās diagnostikas diktāti (mēnesī vairāk nekā 160 stundas audioierakstu), ko rindas kārtībā manuāli apstrādā diktofonu centra operatori.
Lai pēc iespējas automatizētu izmeklējumu aprakstu sagatavošanas procesu, 2019. gadā LU MII un RAKUS uzsāka ERAF praktiskās pētniecības projektu "Latviešu valodas runas atpazīšana un sintēze medicīnas lietojumiem" (1.1.1.1/18/A/153), kurā tika izstrādāta medicīnas jomai pielāgota latviešu valodas runas transkribēšanas un transkripciju pēcapstrādes platforma RUTA:MED. Tā ļauj ārstam pašam ērti rediģēt automātiski transkribēto izmeklējuma aprakstu un uzreiz to nodot ārstējošajam ārstam un pacientam, vienlaikus samazinot diktātu plūsmu uz diktofonu centru.
Projekta laikā tika sagatavoti specifiski latviešu valodas digitālie resursi: apjomīgs vēsturisko izmeklējumu aprakstu korpuss, reprezentatīvs runas korpuss un medicīnas leksikas (terminu, saīsinājumu, medikamentu nosaukumu u.c.) izrunas vārdnīca. Šie resursi ļāva izveidot medicīnai pielāgotu runas atpazīšanas sistēmu.
Šobrīd ir uzsākta RUTA:MED aprobēšana RAKUS un citās Latvijas ārstniecības iestādēs.
Projekta vadītājs Normunds Grūzītis norāda: "Man ir liels gandarījums, ka AiLab komandas ilggadējie starpdisciplinārie pētījumi un sadarbība ar publiskā un privātā sektora partneriem, izstrādājot latviešu valodas digitālos resursus un tehnoloģijas, ļauj ne vien paplašināt mūsu darbību jaunos virzienos, bet arī izstrādāt inovatīvus, sabiedriski un komerciāli nozīmīgus risinājumus."
LU Matemātikas un informātikas institūta Mākslīgā intelekta laboratorija, viena no vadošajām zinātnieku grupām Latvijā, kas nodarbojas ar pētījumiem datorlingvistikā, dabiskās valodas apstrādē un valodas tehnoloģijās, šogad svin 30 gadu pastāvēšanas jubileju. Laboratorijā tiek veikti pētījumi dažādās dabiskās valodas automatizētas apstrādes un mašīnmācīšanās jomās, piemēram, latviešu valodas runas atpazīšanā un sintēzē, teksta gramatiskajā un semantiskajā analīzē, tekstradē. AiLab tiek izstrādāti arī mūsdienīgi valodas resursi – runas un tekstu korpusi, kā arī mašīnlasāmas vārdnīcas.
Plašākai sabiedrībai ir zināma AiLab veidotā vārdnīca "Tēzaurs.lv", kuras mērķis ir apkopot iespējami visus latviešu valodas vārdus un biežāk lietotos vārdu savienojumus. Savukārt platformā "Korpuss.lv" vienotā meklēšanā pieejami vairāk nekā 20 laboratorijas un tās sadarbības partneru veidoti valodas korpusi – teksti vai atšifrēti runas ieraksti, kas paredzēti dažādiem pētījumiem un valodas tehnoloģiju izstrādei.