Pereiti prie turinio

KTU ekspertai apie didžiuosius duomenis: tai yra kertinis dalykas

Svarbiausios | 2021-01-19

Niekam ne paslaptis, kad didieji duomenys yra daugelio šiuolaikinių bendrovių efektyvumo ir sėkmės priežastis. Pradedant rinkodara ir pardavimais, o baigiant logistika ar bankais, stebuklingasis žodžių junginys „didieji duomenys“, atrodo, yra raktas į turtingą rytojų.

Statistika kalba pati už save: 2020-aisiais kiekvienas žmogus kas sekundę sugeneravo 1,7 megabaito duomenų, interneto vartotojai visame pasaulyje – 2,5 kvintilijono baitų kasdien, o didžiųjų duomenų analizės rinka iki 2023 metų turėtų pasiekti 103 mlrd. JAV dolerių.

Kokį vaidmenį didieji duomenys vaidina bankų sektoriuje? Čia skaičiai štai kokie: bankų sektorius didžiųjų duomenų technologijas integruoja į savo veiklą (ir tai daro jau kurį laiką), o šiuo metu augimas yra itin didelis. Pavyzdžiui, 2013-aisiais 64 proc. pasaulinės finansų rinkos jau buvo įdiegę didžiųjų duomenų technologijas į savo infrastruktūrą. 2015-aisiais ši industrija siekė 12 milijardų JAV dolerių, o 2019-aisiais – jau 29,87 milijardų. Prognozuojama, kad didžiųjų duomenų rinka bankų sektoriuje iki 2025 metų gali išaugti iki 62,10 mlrd. JAV dolerių.

Tačiau, kas slepiasi po didžiaisiais duomenimis ir jų technologijomis bankuose ir kokius skaičius galėtume įvardinti kalbėdami ne apie pasaulio, bet apie Lietuvos rinką? Žinome, kad didžiųjų duomenų valdymas bankams visame pasaulyje leidžia pasiūlyti klientams kokybiškesnes paslaugas, padeda kurti naujus ir individualizuotus pasiūlymus savo klientams, taip pat gelbsti siekiant  geriau valdyti riziką. Visa tai tiesiogiai daro įtaką banko veiklos rodikliams, t. y. sėkmei ir pelnui. Teorija teorijai, bet kaip viskas yra iš tikrųjų?

Duomenys visada buvo svarbūs

Pasak bendrovės SEB didžiųjų duomenų specialisto, Kauno technologijos universiteto Matematikos ir gamtos mokslų fakulteto (KTU MGMF) alumno Kęstučio Daugėlos – duomenys finansinėse institucijose visais laikais buvo kertinis dalykas. Dabar skirtumas tik tas, kad duomenų sugeneruojama žymiai daugiau, o juos analizuojant į pagalbą būtina pasitelkti naujus įrankius ir duomenų apdorojimo būdus.

Kęstutis Daugėla

„Dažniausiai viskas priklauso nuo panaudojimo atvejo, t. y., kokio dydžio duomenys, kaip dažnai jie gaunami, ar reikalingas duomenų apdorojimas realiuoju laiku, kokias duomenų struktūras parinkti duomenų produktui. Drauge būtina užtikrinti duomenų saugumą, kokybę, tinkamą jų valdymą, mašininio mokymo algoritmų integraciją, valdyti duomenų gyvavimo ciklą“, – apie darbą su duomenimis banke pasakoja K. Daugėla.

Banke cirkuliuojat vis didesniems duomenų kiekiams, didžiųjų duomenų specialistas kartu su komanda ne tik vysto duomenų infrastruktūrą, bet ir prisideda prie banko transformacijos technologijų srityje – šviečia banko darbuotojus apie duomenų svarbą, pristato įvairius jų apdorojimo įrankius. „Duodame  darbuotojams meškeres, kuriomis jie galėtų susižvejoti idėjų ir priimti sprendimus, pagrįstus duomenų analitika“, – apibendrina K. Daugėla.

Žvejyba duomenų jūroje

Pasaulis greitai keičiasi, o progresas technologijų srityje yra labai spartus. Kasdien atsiranda naujų technikų, mokslininkams ar praktikams kyla naujų minčių, kaip dorotis su vienu ar kitu duomenų iššūkiu. Ne išimtis ir bankų sektorius, kuris, norėdamas žengti pirmosiose gretose, turi veikti progresyviai. Pasak K. Daugėlos, galima būtų įvardyti keletą šiandienos didžiųjų duomenų tendencijų banke: vis populiaresnės tampa realaus duomenų srauto apdorojimo (angl. Streaming) bei debesų technologijos (angl. Cloud Technology).

K. Daugėlos įžvalgoms pritaria ir KTU MGMF doktorantas, dirbantis didžiųjų duomenų mokslo lauke, Mantas Lukauskas. Specialistas teigia, kad jau tampa įprasta, jog galime stebėti vis didesnį didžiųjų duomenų panaudojimą tiek versle, tiek ir kasdieniame žmonių gyvenime ir vis daugiau įmonių, tarp jų ir bankų, kurie ieško kelių, kaip juos pritaikyti savo veikloje.

Mantas Lukauskas

„Dabar, ypač turint mintyje pasaulinę COVID-19 pandemiją, labai svarbus tolesnis debesų technologijų (angl. Cloud Technology) vystymas (šiame kontekste duomenų pasiekimas iš bet kurios vietos tampa dar svarbesnis). Dar galėčiau paminėti išplėstinės analizės (angl. Augmented Analytics) integravimą į įmonių veiklos procesus: ji įgauna vis daugiau reikšmės verslo sprendimų priėmime, nes remiantis mašininiu mokymusi, didžiaisiais duomenimis priimti sprendimus galima daug greičiau“, – tendencijas vardija M. Lukauskas.

Pasak doktoranto, ši sritis progresuoja labai greitai. Įsivaizduokite, 2014 metais GAN (angl. Generative Adversarial Networks) tinklai galėjo sukurti tik nespalvotas ir gana prastos kokybės nuotraukas, o dabar jie gana lengvai kuria aukštos kokybės nuotraukas ir yra pritaikomi net paprastoms telefonų programėlėms. Kitas pavyzdys gali būti ir skaičiavimo galios didėjimas – jei, pavyzdžiui, 2018 metais „Summit“ superkompiuteris buvo 148 PFLOPS galios, tai šiais metais debiutavęs „Fugaku“, kuris pradės veikti 2021, turės jau 415 PFLOPS galią.

„Tik dvejų metų skirtumas, o galia skiriasi beveik 3 kartus! Manau, panašių tendencijų galima tikėtis ir toliau“, – apie pažangą didžiųjų duomenų srityje pasakoja M. Lukauskas.

Technologijos tobulėja ir gali būti pritaikomos vis naujiems iššūkiams spręsti. Pavyzdžiui, prasidėjus COVID-19 pandemijai, mašininis mokymasis buvo greitai pritaikytas ir šioje srityje, prognozuojant susirgimus ir pan.

Žinioms gilinti – verslo iššūkiai

Taigi, didžiųjų duomenų technologijos keičiasi ir kuriamos naujos. Kas už jų slypi? Pavyzdžiui, SEB paslaugų centre Lietuvoje, pasak K. Daugėlos, dirba daugiau nei 1 300 žmonių. Informacinės platformos departamente dirba daugiau kaip 60 specialistų Lietuvoje ir Švedijoje.

Bendrai su didžiaisiais duomenimis dirbančių žmonių banke yra net kelis kartus daugiau. Siekdamas populiarinti didžiųjų duomenų mokslo sritį, SEB praėjusių metų pabaigoje organizavo „Big Data Challenge“ (liet. didžiųjų duomenų iššūkis).

Pasak K. Daugėlos, šis iššūkis suteikia dalyviams galimybę išbandyti save  ir pritaikyti žinias kuriant mašininio mokymosi algoritmus, „pasimatuoti“ darbą su didžiaisiais duomenimis: „pagalvojome, kad būtų įdomu sukurti realią užduotį žmonėms, kurie norėtų pagilinti savo žinias duomenų moksle, persikvalifikuoti į šią sritį ar tiesiog tiems, kuriems patinka spręsti galvosūkius“.

Šiame banko projekte dalyvavo ir MGMF doktorantas M. Lukauskas. Ir ne tik dalyvavo, bet ir puikiai pasirodė. Pasak paties doktoranto, šis iššūkis leido pritaikyti turimas teorines žinias praktiškai, o taip pat suteikė galimybę labiau susipažinti su naujais būdais, kaip galima spręsti tokias – paskolų klasifikavimo – ir panašias banko sektoriaus problemas.