KTU ir VDU mokslininkai kartu kuria ir pritaiko automatinius autorystės stiliaus nustatymo metodus

2015-11-24 12:30

2015 lapkričio 20d. buvo pristatyti projekto “Automatiniai autorių ir autorių grupių individualaus stiliaus nustatymo tyrimai” rezultatai. Autorystės nustatymo metodams sukurti ir pritaikyti jėgas suvienijo trijų sričių specialistai: dr. Jurgita Kapočiūtė-Dzikienė (VDU Informatikos fakultetas), dr. Andrius Utka (VDU Kompiuterinės lingvistikos centras) ir dr. Ligita Šarkutė (KTU Viešosios politikos ir administravimo institutas).

Tyrimų aktualumą lėmė praktinis poreikis identifikuoti tekstų ir pasisakymų autorytę bei nustatyti individualų autoriaus profilį iš jo pasisakymų. Su įvairiomis autorystės nustatymo problemomis susiduria teismo lingvistikos analitikai, interneto forumų administratoriai, socialinių tinklų prižiūrėtojai. Nors autorystę galima nustatyti atlikus teksto stiliaus analizę, tačiau rankinis būdas reikalauja milžiniškų žmogiškųjų išteklių ir nėra toks tikslus, kaip automatinis, taigi, pagrindiniu projekto tikslu tapo siekis surasti automatius metodus, kurie leistų išspręsti autorystės nustatymo bei autoriaus profilio sudarymo uždavinius lietuvių kalbai.

Projekto baigiamojo seminaro metu dr. Andrius Utka apibendrino grožinės literatūros tekstyno analizės duomenis, o dr. Ligita Šarkutė pristatė Seimo posėdžių stenogramų tekstyno naudojimo galimybes socialinių mokslų tyrimuose.

Projekto komanda kviečia aktyviai naudotis sukurtais tekstynais savo tyrimuose. Taikomoji Seimo stenogramų, grožinės literatūros ir interneto komentarų tekstynų vertė yra labai plati, o paskirtis yra labai universali – jais gali naudotis ne tik informatikai ir lingvistai, tačiau ir politologai, sociologai bei kitų socialinių mokslų atstovai: pradedant interneto komentatorių kalbinės raiškos tyrimais ir baigiant politinių partijų ideologinio homogeniškumo analize.

Daugiau informacijos apie projekto rezultatus galima rasti čia.