Par 4. industriālo revolūciju un par to, ka informācijas tehnoloģijas kardināli maina pasauli, kurā dzīvojam, tiek runāts daudz. Notiekošā mērogu var ilustrēt ar dažiem faktiem. Piemēram, 90% no visiem digitalizētajiem datiem ir radīti pēdējo divu gadu laikā. Nākamo divu gadu laikā tiks radīti 40 zetabaiti datu – tas līdzinās četriem miljoniem gadu HD video ierakstu jeb piecu miljardu ASV kongresa bibliotēku krājumiem. Taču tikai 10% no visiem datiem tiek ievākti viegli analizējamā formātā.
Arvien vairāk uzņēmumu izmanto tā saucamos lielos datus, lai radītu milzīgu ekonomisko vērtību. Tā šā gada februārī Šveices farmācijas gigants "Roche" iegādājās tikai pirms sešiem gadiem izveidoto kompāniju "Flatiron Health" par 1,9 miljardiem ASV dolāru. "Flatiron Health" ir datu uzņēmums, kas, izmantojot partnerattiecības ar onkoloģijas klīnikām un lielākajiem medicīnas pētniecības centriem, iegūst gan strukturētus, gan nestrukturētus ar onkoloģiju saistītus datus. Izmantojot savu analītisko kapacitāti, apvienojumā ar elektroniskajiem medicīnisko ierakstu datiem tas iegūst reālajā pieredzē balstītus secinājumus un rekomendācijas.
Pirms desmit gadiem četras vērtīgākās kompānijas pasaulē bija "Exxon Mobil", "Petrochina", "General Electric" un "Gazprom". Šodien tās ir "Apple", "Alphabet" ("Google"), "Microsoft" un "Amazon".
Var rasties jautājums – un kas par to? Lielajā pasaulē top jauni tehnoloģiskie brīnumi, un gan jau pēc kāda laika mēs sagaidīsim, ka no lielajiem datiem radītie jaunie produkti un pakalpojumi tiks piedāvāti iegādei arī Latvijā. Taču mēs uzskatām, ka, pastāvot zināmiem nosacījumiem un pietiekamai uzņēmībai, arī Latvija var būt nevis pasīvs novērotājs, bet jaunās ēras dalībnieks un arī pelnītājs. Kā to izdarīt?
Lielo datu biznesa modeli veido četri elementi, tā saucamie četri A: datu vākšana (Acquisition), apkopošana un uzglabāšana (Aggregation), analīze (Analysis) un pielietojums (Application). Pirmais uzdevums ir saprast, kurā nišā jābūvē sava salīdzinošā priekšrocība.
Datu vākšana
Sensoru tehnoloģijas attīstās arvien straujāk un kļūst pieejamākas, paverot milzīgas iespējas datu vākšanai. Bet sensoru izmantošanai ir jēga tad, ja savāktos datus var efektīvi un operatīvi apkopot un pārraidīt. Tā pirmās valstis, kurās tiks izveidoti 5G tīkli, būs ieguvējas no tā saucamā lietu interneta ("Internet-of-Things" (OoT)) ekspansijas. Tiek lēsts, ka 2020. gadā cilvēki izmantos apmēram 20,4 miljardus lietu interneta iekārtu un tas ievērojami palielinās analīzei pieejamo reāllaika datu apjomu.
Viens no lielākajiem izaicinājumiem šajā procesā ir personīgo datu konfidencialitāte. Lielo datu straujais pieaugums ir izraisījis bažas par pilsoņu privātumu un personīgo datu ļaunprātīgu izmantošanu, ko varētu īstenot Orvela "lielā brāļa" stila valdības vai alkatīgi uzņēmēji. Ir svarīgi atrast līdzsvaru starp personas datu aizsardzību un privātumu no vienas puses un uzticamu vidi, kas veicinātu ekonomiskās vērtības radīšanu, no otras. Šajā jautājumā valstis izvēlas dažādus ceļus. Piemēram, Vācijā ir ļoti stingra nostāja attiecībā uz konfidencialitāti, ierobežojot datu apmaiņu un analīzi. Tas ir kavējis Vācijas uzņēmumu, piemēram, "Siemens", "Daimler" u. c., iespējas ieviest jaunus, uz datiem balstītus uzņēmējdarbības modeļus.
Datu apkopošana un uzglabāšana
Sensoru tehnoloģijas, 5G datu pārraide, lietu internets, arvien lielāki lielo datu apjomi – tas viss nozīmē, ka aizvien vairāk datu tiks saglabāts "mākoņos", starp kuriem dominē "Microsoft", "Amazon" un "Google" krātuves. "Cisco" prognozē, ka lielie dati turpinās veicināt uzglabājamo datu kopējo pieaugumu un 2021. gadā šis apjoms sasniegs 403 EB, veidojot 30% no visos datu centros uzglabājamo datu apjoma.[1]
Analīze
Pašiem datiem nav vērtības, to var piešķirt vien ar datu analīzi sasniedzams mērķis. Šis mērķis ir mākslīgā intelekta ("Artificial Intelligence" (AI)) – algoritmu kopuma, kas ļautu automatizēt tā dēvētos kognitīvos uzdevumus, – izveide.
Pēdējā laikā mākslīgā intelekta izveidē ir gūti lieli panākumi. Piemēram, jau ilgstoši AI izstrādātāju izaicinājums bija iemācīt datoram spēlēt seno ķīniešu galda spēli "Go". Tā ir sarežģīta spēle, kurā iespējamais spēles kauliņu konfigurāciju skaits ir lielāks nekā atomu skaits Visumā. Korporācijas "Google" uzņēmuma "Deep Mind" komandas izstrādātais "Alpha Go" algoritms sākotnēji trenējās ar tūkstošiem šīs spēles spēlētāju, gan amatieriem, gan profesionāļiem, līdz 2016. gadā pārspēja Lī Sedolu (Lee Sedol), tā brīža "Go" čempionu. Savukārt jaunais modelis, kas tika izveidots 2017. gadā ar nosaukumu "Alpha Go Zero", šo apmācību soli izlaida, mašīna mācījās spēlēt pati pret sevi.[2] Sākumā tā zināja tikai spēles pamata noteikumus, tai nebija nekādu iepriekšēju zināšanu par spēli. Pēc trim stundām tā spēlēja kā cilvēks-iesācējs. Pēc trim dienām tā pārspēja savu agrāko versiju – "Alpha Go", bet pēc 21 dienas tā sasniedza līmeni, kurā spēja uzveikt 60 labākos pasaules profesionāļus, tostarp 2017. gada čempionu trijās spēlēs no trim.
Un tomēr, neskatoties uz milzīgiem panākumiem precīzi definētu uzdevumu izpildē, zinātnieki ir ļoti tālu no īsta mākslīgā intelekta. AI attīstības panākumu pamatā – sākot no runas atpazīšanas līdz autonomām automašīnām un veselības aprūpei – ir tieši lielo datu izmantošana. Tam pamatā ir tā saucamā dziļās mācīšanās ("deep learning") tehnoloģija. Tā ir metode, kas ļauj robotiem mācīties un vispārināt savas asociācijas, balstoties uz ļoti lieliem (bieži vien "mākonī" balstītiem) "mācību komplektiem", kas parasti aptver miljoniem piemēru. Saistīta joma ir mākoņrobotikas koncepts. Tajā katrs robots mācās no visu robotu pieredzes, kā rezultātā notiek strauja robotu kompetences izaugsme, jo īpaši – pieaugot robotu skaitam.[3]
Kas no tā visa var sanākt?
Ļoti daudz kas, sākot ar autonomajām mašīnām un beidzot ar tā saucamajām viedajām pilsētām. Arvien vairāk ekspertu uzskata, ka veselības aprūpes jomā revolūcija notiks, ienākot apritē jauniem datu uzkrāšanas, apstrādes un izmantošanas veidiem.[4] Tā IBM nesen izveidoja vienotu komandu ar ASV onkoloģijas centra "Memorial Sloan-Kettering Cancer Center" ārstiem, lai mācītu datoru "Vatsonu" ("Watson") nodrošināt pastāvīgu pacientu aprūpi un noteikt vēža ārstēšanas plānu. Lai to paveiktu, topošajam veselības aprūpes mākslīgajam intelektam ir jāiemāca, kā analizēt milzīgu, parasti nestrukturētu, informācijas daudzumu. Mācīšanas procesā salīdzinošai novērtēšanai un modeļa atpazīšanai tiek izmantoti dati no 600 000 medicīnisko faktu aprakstiem, 1,5 miljonu pacientu ierakstiem un klīniskajiem pētījumiem, kā arī divi miljoni lappušu teksta no medicīnas žurnāliem. Un, jo vairāk dators mijiedarbojas ar reālām situācijām, jo ātrāk tas var iemācīties un uzlabot sniegumu, nosakot medicīniskās problēmas un to ārstēšanas veidus.
Kādi ir secinājumi Latvijai?
Protams, jābūt reālistiem. Pie minētajiem izaicinājumiem strādā pasaules vērtīgākie uzņēmumi, kuri spēj piesaistīt vislabāko zinātnisko cilvēkkapitālu. Piemēram, tikai "Google" strādā gandrīz 74 000 augstākās raudzes speciālistu. Salīdzinājumam, Latvijā ik gadu parādās vien daži simti absolventu ar izglītību IT jomā. Kā un ar ko Latvija varētu ieinteresēt kādu no pasaules gigantiem lielo datu jomā?
Mūsuprāt, atbilde ir acīmredzama. Sākotnējais piedāvājums jāveido tieši lielo datu vākšanas jomā. Izmantojot šo piedāvājumu, starptautiskās kompānijas jāpārliecina izmantot Latvijas cilvēkkapitālu arī darbam pie iegūto lielo datu analīzes un pieslēgt uzņēmīgus prātus arī mēģinājumiem radīt jaunu pielietojumu lielajiem datiem.
[1] Cisco. 2018. Cisco Global Cloud Index: Forecast and Methodology, 2016–2021, White Paper. https://www.cisco.com/c/en/us/solutions/collateral/service-provider/global-cloud-index-gci/white-paper-c11-738085.html#_Toc503317524
[2]Hassabis, D. and Silver, D. 2017. AlphaGo Zero: Learning from scratch. https://deepmind.com/blog/alphago-zero-learning-scratch/
[3]Pratt, G. A. 2015. Is a Cambrian Explosion Coming for Robotics? Journal of Economic Perspectives, 29 (3), 51–60.
[4]Cohn, J. 2013. The Robot Will See You Now. The Atlantic, March. Issue.https://www.theatlantic.com/magazine/archive/2013/03/the-robot-will-see-you-now/309216/