Foto: Shutterstock
Mākslīgā intelekta iespējotas runas atpazīšanas tehnoloģijas kļūst jaudīgākas un precīzākas ar katru gadu. Šodien iespējamie rezultāti pirms desmit gadiem šķistu teju vai fantastika. Tomēr nu neirozinātnieki un mākslīgā intelekta pētnieki sper soļus virzienā, kas nākotnē par realitāti var padarīt arī domu "lasīšanu".

Proti, Kalifornijas Universitātes pētnieku komanda akadēmiskajā izdevumā "Nature Neuroscience" publicējusi izklāsta pētījumu par smadzeņu aktivitātes pārvēršanu tekstā, proti, teksta ģenerēšanu, subjektam skaļi neizdvešot ne zilbes (to vari lasīt šeit).

Pētījumā iesaistīti četri cilvēki, kuri cieš no epilepsijas un kuriem ir smadzeņu implanti epilepsijas lēkmju monitorēšanai.

Mākslīgā intelekta trenēšanai katram no pētījuma dalībniekiem lūgts skaļi un vairākas reizes nolasīt 50 teikumus, tostarp "Tīna Tērnere ir popdziedātāja," un "Tie zagļi nozaga 30 dārgakmeņus!" Izmantojot pētījuma dalībnieku smadzenēs jau esošos epilepsijas monitorēšanas implantus, tika monitorēta smadzeņu aktivitāte (būtībā elektriskie impulsi), un šie dati izmantoti, lai palīdzētu mākslīgajam neironu tīklam analizēt, un "savilktu kopā", kā konkrēta smadzeņu aktivitātes aina korespondē ar konkrētiem tajā brīdī izrunātiem burtiem, frāzēm, mutes kustībām, citiem runas raksturlielumiem.

Pēc tam citam mākslīgajam neironu tīklam šī reprezentācija bija jādekodē atpakaļ teikumos.

Labākajā no piemēriem precizitāte bija pat 97%, taču bija arī virkne kļūdu, kur dekodētais teksts it nemaz neatbilda iepriekš lasītajam. Tas daļēji, protams, skaidrojams ar pagaidām ļoti ierobežoto datu apjomu, kas bija pieejams mākslīgā intelekta trenēšanai.

Piemēram, te dažas no kļūdām (angliski, jo šoreiz kļūdu izprašanai būtiska vārdu fonētika oriģinālvalodā):

  • "Those musicians harmonise marvellously" dekodēts kā "The spinach was a famous singer";
  • "A roll of wire lay near the wall" dekodēts kā "Will robin wear a yellow lily";
  • "The museum hires musicians every evening" dekodēts kā "The museum hires musicians every expensive morning";
  • "Part of the cake was eaten by the dog" dekodēts kā "Part of the cake was the cookie"
  • "Tina Turner is a pop singer" dekodēts kā "Did Turner is a pop singer".


Tomēr, kaut aizvien priekšā ir virkne problēmu, kas jāatrisina, lai šis kļūtu par praktiski pielietojamu rīku, kas, piemēram, varētu palīdzēt izteikties cilvēkiem ar runas traucējumiem, potenciāls ir liels. Jāņem vērā, ka šajā neliela mēroga pētījumā pagaidām datu bāze ir vien dažas stundas runas, krietni par maz, lai radītu jaudīgu algoritmu smadzeņu bioelektriskās aktivitātes pārnešanai tekstā. Tas pierādījās, pētnieku komandai mēģinot uzdot algoritmam dekodēt tekstu, kas nav saistīts ar treniņā izmantotajiem 50 teikumiem. Šajos gadījumos dekodēšanas precizitāte krasi kritās.

Māstrihtas Universitātes eksperts Kristians Herfs, kurš nav saistīts ar šo pētījumu, uzsvēra, ka sasniegums ir ļoti daudzsološs, ņemot vērā, ka pētījumā izmantotie dati ir mazāk nekā 40 minūtes runas no katra dalībnieka, izmantojot ierobežotu teikumu kopu, kurpretī pamatīgai mākslīgā intelekta apmācīšanai ierasti nepieciešamas tūkstošiem un tūkstošiem stundu.

Herfs norāda arī uz vēl vienu aspektu, kas jāņem vērā – šī pētījuma dalībnieki teikumus izrunāja skaļi, taču nav zināms, cik lietojami būtu smadzeņu bioelektriskie impulsi, kad runa ir par pacientiem, kas nespēj parunāt. Smadzeņu aktivitāte, tekstu tikai iedomājoties, var atšķirties no tās, kāda fiksējama, ja teikumus izrunā skaļi. Šis arī ir viens no pētījumu virzieniem nākotnē, lai varētu pilnveidot praktiski pielietojamu "runas protēzi" tiem, kas dažādu veselības likstu dēļ nespēj vai nu parunāt, vai rakstīt, vai abus.

Seko "Delfi" arī Instagram vai YouTube profilā – pievienojies, lai uzzinātu svarīgāko un interesantāko pirmais!