Foto: Publicitātes foto

Mūsdienās dati ir kļuvuši par vērtīgāko resursu pasaulē – ne velti tos dēvē par jauno zeltu vai naftu. No viedtālruņiem līdz satiksmes kamerām un meteoroloģiskajiem satelītiem - modernās tehnoloģiju ierīces vāc milzīgus datu apjomus, kas noder visdažādākajās jomās, sākot no vēža pētījumiem, biznesa un finansēm līdz pilsētu plānošanai, zinātnei, mašīnbūvei un veselības aprūpei. Datos balstīti lēmumi ļauj mums labāk izprast apkārtējo pasauli. Ne vien risinājumi, kas nepieciešami uzņēmumiem, satur datus, bet nereti stratēģijas, lēmumi un darbības ir balstītas tieši datos. Analizējot datus, tiek modelētas situācijas vai izteiktas prognozes, kas ļauj ne tikai pieņemt precīzākus un izdevīgākus lēmumus, bet arī izvairīties vai sagatavoties situācijām, kas var ietekmēt uzņēmuma izaugsmi negatīvi. Vienlaicīgi dati ļauj labāk izprast rezultātus un izpildi, kā veidot vai attīstīt produktus nākotnē, kā paaugstināt efektivitāti, kā arī uzlabot klientu pieredzi un ne tikai.

Datu inženierija ir nozare, kas ļoti strauji attīstās, tā nodarbojas ar datu vākšanu, apstrādi, glabāšanu un analīzi. Lai dati būtu vērtīgi un izmantojami, tie ir jāvāc, jātīra un jāorganizē, šis process ir laikietilpīgs, jo tiek iesastīti dažādi speciālisti. Datu inženieri izstrādā sistēmas un rīkus, kas ļauj citiem piekļūt datiem un tos izmantot. Bez datu inženieriem mēs nevarētu efektīvi izmantot datus, kas mums ir pieejami. Ir svarīgi atšķirt divu veidu datus: reālos un sintezētos. Reālie dati tiek iegūti reāllaikā, jebkurā vietā pasaulē, piemēram, sensoru datu savākšana vai aptauju veikšana. Savukārt sintezētie dati tiek ģenerēti mākslīgi, izmantojot algoritmus un mašīnmācīšanos. Abi datu veidi ir vērtīgi, un tos var izmantot dažādiem mērķiem.

Nav darba pieredzes? Veido CV un projektu portfolio jau studiju laikā

Mūsdienu darba sludinājumos visbiežāk tiek prasīta pieredze vai prakse attiecīgajā jomā, kas parāda, ka kandidāts ir zinošs. Tomēr studentiem, kas tikko absolvējuši augstskolu, visbiežāk pietrūkst prakses vai pieredzes pielietot zināšanas darba ikdienā. Jāatzīmē, ka arī studiju laikā studenti var krāt zināšanas un pieredzi, piemēram, piedaloties projektos, hakatonos, konkursos, kā arī veicot kādu brīvprātīgo darbu. Arī šādu pieredzi darba devējs var ieskaitīt kā profesionālo darbību. Ir tikai jāatceras, ka, pilnvērtīgi to aprakstot, to var pievienot savam CV vai īstenoto projektu portfolio. Transporta un sakaru institūta (TSI) maģistra līmeņa dubultā diploma programma datorzinātnēs "Datu analītika un mākslīgais intelekts" studentiem dalība projektos ir neatņemama studiju procesa sastavdaļa, kur praktiski var izmēģināt un apgūt dažādas zināšanas un prasmes. Kas ir būtiski, ka jau studiju ietvaros viņus aicina veidot savu īstenoto projektu portfolio, kas noderēs turpmākajā karjerā. Šī ir arī lieliska iespēja studentiem, kuriem nav darba pieredzes, parādīt savas prasmes. Ja citu valstu izglītības un darba kultūrās šādu portfolio izveide jau ir neatņemama sastāvdaļa, tad Latvijā tā vēl tikai attīstās. TSI studentiem ir iespēja savā pieredzes bagāžā pievienot vismaz divus projektus – starpdisciplinārais grupas projekts, maģistra darbs.

Foto: Maksims Iljins, TSI maģistra programmas Datu analītika un mākslīgais intelekts students

"Kopā ar kolēģiem maģistra studiju laikā TSI esam īstenojuši daudzus projektus: bija gan lielo datu apstrāde mākoņos, gan lielu valodas modeļu precizēšana, gan pat fundamentāla lietojumprogrammas izstrāde sabiedriskā transporta jomā. Taču īpaši vēlos pieminēt projektu par sintētisko datu ģenerēšanu personīgās mobilitātes jomā, ko īstenojām kopā ar kolēģi Sigitu Lapiņu un doktorantu Frančesko Mariju Turno no Itālijas. Šis projekts ļāva man iedziļināties akadēmiskā darba praktiskajā daļā, strādāt ar izcilo Saseksas Huawei Locomotion datu kopu, iepazīties ar jaunākajiem modeļiem sintētisko laika rindu un tabulāro datu ģenerēšanas jomā (CTGAN) un pilnībā izbaudīt mūsu komandas labi koordinēto darbu," stāsta Maksims Iljins, kas ir viens no komandas dalībniekiem, kuri kopīgi īstenoja starpdisciplināro projektu.

Studentu veiktais pētījums objektīvi pierādīja CTGAN priekšrocības sintētisko personas mobilitātes datu ģenerēšanā, kas ir ļoti svarīgi sais ībā ar vispārējo datu aizsardzības regulu (VDAR) un personas informācijas aizsardzību, un šīs komandas vadītājs Frančesko to veiksmīgi prezentēja starptautiskā konferencē Amsterdamā šajā pavasarī.

Sigitas Lapiņas pārziņā bija vairāki pienākumi, arī sintētisko datu ģenerēšana: "Galvenā ideja bija vienkārši izpētīt, kā notiek pārvietošanās Anglijā. Iesākumā jau bija gana daudz datu, kas jau bija derīgi, taču tajā pašā laikā vajadzēja ģenerēt sintētiskos datus, kas mums iztrūka. Mēs pētījām, kā to labāk darīt, kā noteikt, vai sintētiskie dati ir derīgi vai nē. Mēs zīmējām kartes, lai saprastu, kā tas izskatās dzīvē. Kā to raksturot sadzīvē? Piemēram, no milzīgās datu kopas tiek izvilkti dati. Ja cilvēkam ir astma, tad varētu veidot kartes, kur, kurā brīdī labāk atrasties vai tieši otrādi – nedoties, jo ir daudz ziedputekšņu, kas var kaitēt veselībai. Bija arī diezgan daudz literatūras jāapskata, lai varētu uzrakstīt šo rakstu. Un rezultātā mums ir raksts, kas pavisam drīz tiks publicēts. Es nekad dzīvē nebiju ģenerējusi sintētiskos datus, es biju tikai dzirdējusi par tiem. Interesanti bija gan kaut ko tādu apgūt, gan izprast, kāpēc kaut kas tāds vispār tiek izmantots."

TOP studiju priekšmeti

Maģistra līmeņa dubultā diploma programma datorzinātnēs "Datu analītika un mākslīgais intelekts ietvaros studenti apgūst dažādus priekšmetus, piemēram, informācijas sistēmas, kiberdrošību, BI un vizualizāciju, mākoņskaitļošanu un citus.

Sigitai jau kopš bakalaura studiju laikiem ir padevušies priekšmeti, kuros ir vairāk jādomā un jārisina uzdevumi, piemēram, matemātika: "Maģistra laikā man patika supertehniskie priekšmeti, lai arī man patīk runāt, man ļoti patīk iet cilvēkos, bet man patīk arī tehniskie priekšmeti. Mašīnmācīšanās un prognozēšanas analītika, datu izrace – tie laikam arī bija paši mīļākie priekšmeti. Tajā pašā laikā man patika arī IT projektu vadība, jo es ar to saskaros darba ikdienā, bet nezināju teoriju. Man ļoti patika, kā mums to pasniedza. Ņemot vērā, ka dati un viss ar to saistītais mainās katru dienu, tad vienkārši konstanti ir jāmācās, lai būtu lietas kursā, kas notiek pasaulē. Es noteikti negribu pazaudēt to, ka es katru dienu turpinu kaut ko jaunu apgūt, citādi manā profesijā nav vietas. Jo kas šodien ir jaunums, rīt jau ir vēsture. Taču vienlaicīgi jāspēj kritiski uz visu paskatīties. Man reizēm darbā jautā, kāpēc mēs neizmantojam konkrētu modeli. Tad es atbildu, ka viss par un ap to vairāk bija mārketings, ka realitātē tas modelis nemaz nav tik labs vai atbilstošs. Tāpēc uz visu ir vērts skatīties ar mazu šķipsniņu skepses."

Foto: Sigita Lapiņa, TSI maģistra programmas Datu analītika un mākslīgais intelekts studente

Maksims atzinīgi vērtē to, ka TSI ir izveidota sadarbība ar Coursera, kas ļauj kādu īpašu tēmu apgūt padziļināti, jo nereti mācību kursa ietvaros konkrētas tēmas izziņai ir paredzēts samērā īss laiks. Ar tiešsaistes mācību platformas palīdzību varēja apgūt dažādas lietas.

"Vispirms es gribētu pieminēt datu ieguves un mašīnmācīšanās un prognozējošās analītikas priekšmetu kopumu, ko pasniedza profesore Irina Jackiva un docente Jeļena Kijonoka. Statistika un ekonometrija man vienmēr ir bijis "ciets rieksts". Nevaru teikt, ka bija viegli, bet ar pasniedzēju un papildu materiālu palīdzību šis "rieksts" tika atrisināts. Man ir samērā liela pieredze projektu vadībā, mans bakalaura grāds ir veltīts šai specialitātei, un MBA programmas ietvaros es apguvu projektu vadīšanas zināšanu kopuma (jeb PMBOK) kursu, tāpēc projektu vadības kurss mani interesēja padziļināti - kā šis priekšmets tiks pasniegts TSI. Un jāsaka, ka man nenācās vilties, jo projektu un produktu vadības kurss bija ļoti vispusīgs ar daudz praktiskiem uzdevumiem un palīgmateriāliem, kurus mēs uzreiz izmantojām darbā pie starpdisciplinārā projekta. Jāsaka, ka ir ļoti vērtīgi, ja apgūtās teorētiskās zināšanas un ietvarus var praktiski uzreiz izmēģināt praksē, nostiprināt, darbojoties dinamiskās komandās," stāsta Maksims.

Maģistra darba tēma – aktuāla, interesanta, praktiska

Starpdisciplinārais projekts, studijas un maģistra darba aizstāvēšanas jau noslēgušās. Studenti savu kvalifikācijas darbu tēmas izvēlējušies tādas, lai tās būtu pēc iespējas aktuālākas, kā arī saistītas ar viņu darbiem.

Sigita ikdienā strādā ar RAG sistēmām, tāpēc maģistra darbu izvēlējās saistīt ar šo tēmu: "Mēs lielākā daļa zinām "ChatGPT", tam vienā brīdī aptrūkst zināšanu, jo konkrētos modeļus pārstāj trenēt. Piemēram, ja tev ir jauna kompānija vai pētījumi, tad tie visdrīzāk nebūs iekļauti sistēmā, jo tie ir jaunākie dati. Pārtrenēt šos modeļus ir ļoti dārgi. Viens no veidiem, ko izmanto nozarē, datu zinātnē vai vispār inovācijās, ir šīs RAG sistēmas. Tiek pievienota datu kopa. Tad vispirms sameklēta informācija šajā datu kopā, tad šī informācija tiek izgūta, tad kopā ar jautājumu nosūtīta modelim, tad tikai tiek ģenerēta atbilde. Tad ir pašas jaunākās atbildes, pati aktuālākā informācija un var izvairīties no halucinācijām jeb kļūdām, jo kādreiz gadās, ka "ChatGPT" samelo par kaut ko. Tas ir tikai tāpēc, ka tas vienkārši kaut ko nezina. Es mēģināju optimizēt šīs sistēmas dažādiem uzdevumiem."

Savukārt Maksims savā maģistra darbā veic 4 dažādu pieeju salīdzinošu analīzi, lai ģenerētu SQL vaicājumus, pamatojoties uz lietotāju jautājumiem dabiskajā valodā. Pēc būtības šī pieeja ļauj vienkāršam biznesa lietotājam bez datu analīzes prasmēm un zināšanām par SQL uzdot jautājumus milzīgai uzņēmuma datubāzei un saņemt skaidras atbildes, līdz pat profesionāli sagatavotiem analītiskiem ziņojumiem ar grafikiem un tabulām: "Šī tēma man neienāca prātā uzreiz, pašā sākumā es šaubījos par lielo valodas modeļu interpretējamību, taču pasniedzēja un pasaules uzņēmējdarbības tirgus atsauksmes palīdzēja man precizēt manu tēmu. Pasniedzējs ieteica, ka lielo valodas modeļu interpretējamība ir ļoti jauna tēma, man būtu grūti atrast uzticamus avotus, lai ar to strādātu. Tirgus skaidri parādīja pieprasījumu pēc koda ģenerēšanas, izmantojot lielo valodas modeli jeb LLM, kas ir mākslīgā intelekta (MI) programma, izstrādāta, lai saprastu, interpretētu un ģenerētu cilvēkiem līdzīgu tekstu, pamatojoties uz datiem, par kuriem tā ir apmācīta. Un mans darba vadītājs - Deloitte partneris Centrāleiropā, TSI akadēmiskais padomnieks mākslīgā intelekta virziena attīstības jautājumos – Igors Rodins palīdzēja man koncentrēties uz Text-to-SQL ģenerēšanu kā virzienu, ko pieprasa lielas korporācijas. Un nav brīnums, atliek tikai iedomāties strukturētās datubāzēs uzkrāto datu apjomu un daudzveidību, uzreiz kļūst skaidrs šīs tehnoloģijas potenciāls."

Ikvienam maģistra darbam ir potenciāls kļūt arī par promocijas darbu, ko pētīt un izzināt doktorantūras studijās.

Maģistra grāds datu analītikā pusotra gada laikā - reāla iespēja ikvienam

Šobrīd TSI piedāvā maģistra līmeņa studiju programmas, kurās studiju process aizņem vien gadu, kam papildus klāt ir arī diplomdarba izstrāde. Šāds studiju formāts tiek piedāvāts gandrīz visām TSI maģistrantūras programmām, uzsākot studijas jau šajā rudenī. Šī ir lieliska iespēja ikvienam, īpaši strādājošajiem profesionāļiem, pusotra gada laikā paaugstināt savu kvalifikāciju, iegūstot aktuālas, savai profesijai nepieciešamas zināšanas, ieviest jauninājumus savā darba vietā, saņemot pat 2 diplomus vienā studiju periodā (dubultā diploma programmās). Bet, ja esat nolēmis mainīt savu kvalifikāciju, tad šī ir iespēja to izdarīt. Pieteikties studijām var ikviens. Ja nepieciešamo zināšanu apjoms būs nebūs pietiekošs, tad būs iespēja apgūt priekšmetus sagatavošanās semestra laikā.

"Šai pasaulei ir nepieciešams vairāk inteliģences. MI var padarīt cilvēkus stiprākus un dot mums iespēju sasniegt biznesa mērķus un uzlabot mūsu dzīvi. Mūsu maģistra studiju programma ir aizraujošs ceļojums uz nākotnes MI pasauli, kas sākas no datiem, attīsta analītiskās un programmēšanas prasmes, kopīgi apgūt moderno statistiku un mašīnmācību, palīdz labāk izprast ar MI darbināmus aģentus un ierīces, un sniedz iespēju izveidot savus unikālos MI risinājumus," uzsver maģistra līmeņa dubultā diploma programmas datorzinātnē "Datu analītika un mākslīgais intelekts" programmas direktors, profesors Dmitrijs Pavļuks.

Jāpiebilst, ka šogad TSI augstskolai aprit 25 gadu jubileja, un tai par godu tiek piedavāta īpaša 25% atlaide studiju maksai visos līmeņos. Kā arī jau jūlijā tiks atvērta pieteikšanās budžeta vietām maģistra studiju programmās. Lai uzzinātu aktuālāko informāciju, apmeklējiet tīmekļa vietni www.tsi.lv

Seko "Delfi" arī vai vai Instagram vai YouTube profilā – pievienojies, lai uzzinātu svarīgāko un interesantāko pirmais!