Kauno technologijos universitetas – atvirojo mokslo technologijų priešakyje

Svarbiausios | 2020-11-27

Dr. Audronė Telešienė, dr. Giedrius Žvaliauskas

KTU SHMMF Duomenų analizės ir archyvavimo centras

Tarptautiniai ekspertai Kauno technologijos universiteto vystomą humanitarinių ir socialinių mokslų duomenų archyvą LiDA įvertino kaip geriausią Lietuvoje. Tuo pačiu pasiektas reikšmingas susitarimas su tarptautiniu archyvus vienijančiu konsorciumu CESSDA-ERIC.

Šiuolaikiniuose humanitariniuose ir socialiniuose tyrimuose vis dažniau remiamasi įvairiose talpyklose publikuotais ir pakartotiniam naudojimui atvertais empirinių duomenų rinkiniais. Duomenų atvėrimas – geroji augančios tyrimų kultūros praktika. Galėjimas kombinuoti kelis duomenų rinkinius padidina analitinį potencialą. O pakartotinis duomenų naudojimas – didina viešaisiais pinigais finansuotų projektų duomenų ekonominę vertę.

Lietuvoje veikia kelios socialinių tyrimų duomenų talpyklos, iš kurių aukščiausią tarptautinių ekspertų vertinimą gavo KTU SHMMF Duomenų analizės ir archyvavimo centro (DAtA centro) administruojamas Lietuvos humanitarinių ir socialinių mokslų duomenų archyvas (LiDA). Ekspertų pateikiamoje ataskaitoje teigiama, kad LiDA geriausiai įvertinta pagal tai, kaip lengva atrasti šiame archyve pateikiamus duomenų rinkinius, bei pagal duomenų rinkinių prieinamumą. Šiuo metu LiDA archyve galima rasti daugiau nei 600 apklausų, politinės sistemos ir istorinės statistikos duomenų rinkinių. LiDA paslaugomis naudojasi virš 3000 tyrėjų, praktikų ir studentų.

Vystydamas archyvo veiklą ir siekdamas didesnės tarptautinės integracijos DAtA centras bendradarbiauja su Europos socialinių mokslų duomenų archyvų konsorciumu (CESSDA ERIC). Siekiama užtikrinti Europos socialinių, humanitarinių ir kitų giminingų disciplinų tyrėjams atvirą ir nemokamą prieigą prie aukščiausios kokybės europinių empirinių duomenų išteklių.

Vienas iš įrankių šiam tikslui įgyvendinti – naudojamas daugiakalbis Europos kalbų socialinių mokslų tezauras (angl. European Language Social Science Thesaurus – ELSST). ELSST yra indeksavimo ir paieškos įrankis, įgalinantis paiešką Europos duomenų archyvuose. ELSST sukaupta daugiau nei 3000 raktinių žodžių, kurie apima politikos mokslų, sociologijos, ekonomikos, švietimo, teisės, nusikalstamumo, demografijos, sveikatos, užimtumo, informacinių ir komunikacinių technologijų bei aplinkos mokslų sritis. ELSST kasmet yra atnaujinamas ir verčiamas iš anglų kalbos į kitas Europos kalbas ir taip yra kuriamas ryšių tarp reikšminių žodžių tinklas. Šiuo metu į ELSST integruota 14 kalbų: čekų, danų, olandų, anglų, suomių, prancūzų, vokiečių, graikų, lietuvių, norvegų, rumunų, slovėnų, ispanų ir švedų.

Vartotojai iš Lietuvos, pavyzdžiui, gali atlikti užklausą lietuvių kalba, o ELSST daugiakalbio tezauro dėka paieška bus vykdoma iš karto visomis keturiolika kalbų. Kitaip tariant, naudojant lietuviškus raktinius žodžius atliekama duomenų paieška kitomis kalbomis ir galima surasti reikalingus duomenis esančius kituose Europos šalių duomenų archyvuose.

CESSDA ERIC perėmus ELSST vystymą iš Esekso universiteto (Jungtinė Karalystė), nuo 2020 m. lapkričio 16 d. Europos kalbų socialinių mokslų tezauras yra prieinamas per specialią platformą, kuri skurta naudojant atviro kodo internetinį SKOS (angl. Simple Knowledge Organization System) naršymo ir publikavimo įrankį „Skosmos“. Užtikrinant ELSST tezauro terminų lietuvių kalba įtraukimą į bendrąjį paieškos variklį, 2020 m. lapkričio mėn. 12 d. KTU ir Europos mokslinių tyrimų infrastruktūrų konsorciumas „Europos socialinių mokslų duomenų archyvų konsorciumas“ (CESSDA ERIC) pasirašė licencinę sutartį, suteikiančią teisę CESSDA ERIC naudoti ir platinti ELSST versiją lietuvių kalba.