Pereiti prie turinio

Vienos universiteto mokslininkas Ronald Hochreiter. Didieji duomenys: daugiau ne visada geriau

Svarbiausios | 2020-09-15

Niekam ne paslaptis, kad didieji duomenys (angl. Big Data) yra vienas svarbiausių šiuolaikinių verslų variklių ir daugelis įmonių žino, ko galima siekti ir ką pasiekti juos protingai „įdarbinus“. Teoriškai viskas skamba puikiai. Bet ar tikrai visi žino, kaip tai padaryti?

Kad teorija ir praktika žygiuotų darniai koja kojon, reikia daug mokytis. Mokytis reikia ir vadovams, ir patiems duomenų specialistams. Didžiųjų duomenų (ir čia turėkime minty ne tik pačius duomenis, bet ir didžiųjų duomenų metodus ir technologijas) sritis keičiasi labai sparčiai, tad ir įmonės turi sparčiai prie tų pokyčių prisitaikyti.

„Ko gero dabar sunkiai berastume sektorių, kuriame tinkamas duomenų analizės procesas neatneštų aiškios ir pamatuojamos naudos ar konkurencinio pranašumo. Tačiau reikia suprasti, kad svarbu yra ne tai, kiek duomenų, bet kokie duomenys, ir svarbiausia – turėti sumanių specialistų tiems duomenims tvarkyti. Tik jų dėka galima priimti reikšmingus duomenimis grįstus sprendimus“, – įsitikinęs vienas iš šių metų „KTU Big Data School“ lektorių Vienos universiteto mokslininkas Ronald Hochreiter.

Daugiau = geriau?

Duomenų kiekiai kasdien vis auga ir augs ateityje. Ar iš tų sunkiai suvokiamų duomenų srautų apimčių galima ištraukti prasmę? „Taip, tik turėkime minty, kad daugiau ne visada yra geriau“, – tvirtina mokslininkas.

Pasak R. Hochreiter, nemažai didžiųjų duomenų analitikos (DDA) projektų būna nesėkmingi, nes žmonės linkę manyti, kad į sistemą įvedus daugiau duomenų, rezultatai bus geresni, t. y. daugeliu atvejų, kai nėra aiškios struktūros, kuriai buvo sukurti mašininio mokymosi modeliai, daugiau duomenų reiškia mažiau reikšmingus rezultatus.

„Modeliai turėtų būti kiek įmanoma mažesni (ypač atsižvelgiant į įvairių panaudojamų požymių skaičių), o automatinių požymių konstravimo metodų geriau apskritai vengti“, – pataria mokslininkas.

Tobulėjimas yra raktas

Šiuolaikinis verslas išties turi daug žinių apie DDA ir supranta, kokią naudą tai gali jiems atnešti. Supranta ir tai, kad labai svarbu tobulėti. Bet, pasak mokslininko, nepakanka visus darbuotojus tiesiog išsiųsti į   internetinius kursus – labai svarbu yra praktiniai mokymai, susiję su realiais atvejais įmonėse.

„Pavyzdžiui, investicijų bankas „J. P.Morgan“ dar 2017 m. pateikė savo ataskaitoje, kad žymiai lengviau išmokyti domenų ekspertus dirbtinio intelekto (DI), nei paaiškinti DI guru gana komplikuotas domeno žinias, kurioms giliai suprasti reikia daug metų praktikos“, – kalba R. Hochreiter.

Tokie, į įmonių specialistus orientuoti renginiai kaip „KTU Big Data School“, suteikia galimybę įvairių sričių ekspertams išmokti naudoti įvairius DDA metodus: tiek išgirsti naujausią teoriją, tiek ir pritaikyti ją praktiškai seminarų metu.

DDA žymiai paveikė tradicinius verslo, gamybos ar viešojo sektoriaus procesus. Ir didžiausią naudą, pasak mokslininko, ateity turės tos įmonės, kur tinkami, t. y. sumanūs specialistai analizuoja ir interpretuoja teisingus/kokybiškus duomenis.

Rizikų neišvengsime

Duomenims, duomenų analitikai ir DI vis labiau skverbiantis į verslus ir mūsų gyvenimus apskritai, pradedama įžvelgti įvairių rizikų. Apie DI etiką ir teisinį reguliavimą kalbama jau kurį laiką, tačiau R. Hochreiter siūlo pažvelgti į tai dar kitu kampu.

Pasak mokslininko, žalinga aklai tikėti metodais, o taip pat ir žmonėmis, kurie be jokios kritikos tiki tuo, ką „ypatingai fantastiškas“ gilusis tinklas ar „XGBoost“ (labai populiarus įvairiuose taikymuose metodas) jam suskaičiuoja. Nereikia aklai pasitikėti ir įvairiais tikslumo matais, kurie neretai pernelyg optimistiškai nuteikia dėl vienokio ar kitokio verslo sprendimo sėkmės.

„Didelė rizika yra ta, kad dažnai verslo žmonės nelinkę pripažinti, jog tikrasis iššūkis yra netrumpas laiko intervalas, reikalingas analitinių modelių rezultatų pavertimui į prasmingą verslo procesą gerinantį sprendimą“, – apie iššūkius DDA srityje svarsto R. Hochreiter.

Renginyje – aktualios temos

Didžiųjų duomenų mokslas ir DI skverbiasi į kone visas šiuolaikinio verslo ir pramonės sritis, viešąją sektorių. Vis svarbesnę vietą šių technologijų taikymas užima ir bankininkystės, finansų srityse.  Uždavinius pasitelkiant DDA ir DI įmonės sprendžia įvairiausius: nuo bankomatų pildymo optimalių maršrutų  ar jų techninės priežiūros tvarkaraščių sudarymo, iki kovos su pinigų plovimu ir sukčiavimo prevencija ar asmeninės bankininkystės pasiūlymų.

„Norint sėkmingai susidoroti su šiomis ir kitomis finansų sektoriaus problemomis, reikia subalansuoto matematinio modeliavimo, optimizavimo ir mašininio mokymo  derinio. Dirbtinis intelektas visa tai apjungia, pavyzdžiui, kad įgalintų automatinį modelių persikalibravimą pasikeitus rinkai ar vykstant įvairiems makroekonominiams procesams.  Pavyzdžiui, leisti automatiškai iš naujo tikrinti atitinkamą sprendimo modelį, kad jis autonomiškai prisitaikytų prie besikeičiančių rinkos ar makroekonominių pokyčių“, –– apie savo paskaitų ir seminarų turinį „KTU Big Data School“ 2020 pasakoja lektorius.

KTU Big Data School 2020, renginys mokslininkams ir praktikams, dirbantiems su didžiaisiais duomenimis, vyks šių metų rugsėjo 30-spalio 2 dienomis. Jo metu bus aptariamos duomenų klasifikavimo ir klasterizavimo problemos, rekurentinių dirbtinių neuronų tinklų taikymas bei duomenų mokslo ir DI metodų taikymas bankų veikloje bei finansuose.

Daugiau informacijos apie renginį – https://bigdataschool.ktu.edu