Pereiti prie turinio
ieškoti

KTU ekspertas: dirbtinio intelekto sugeneruoti vaizdai – kur prasideda kūryba, o kur tik kopija?

Svarbiausios | 2025-06-02

Vis daugiau žmonių ima eksperimentuoti su dirbtinio intelekto sugeneruotais vaizdais – vieni iš smalsumo, kiti siekdami greito rezultato socialiniams tinklams, darbui ar net verslui. Atrodo patogu: įvedi kelis žodžius ir po akimirkos turi nuotrauką. Tačiau ar kada susimąstėte, ką iš tiesų darote – kuriate, kopijuojate ar tiesiog naudojatės kitų sukurtomis idėjomis?

Pasak dr. Manto Lukausko, Kauno technologijos universiteto Matematikos ir gamtos mokslų fakulteto (KTU MGMF) mokslininko ir „Hostinger“ dirbtinio intelekto (DI) technologijų vadovo, dauguma šiuolaikinių DI modelių, generuojančių vaizdus – ypač tų, kurie paremti difuzijos (angl. diffusion) principais – veikia pagal sudėtingą procesą. Jie „mokomi“ analizuojant milžiniškus kiekius egzistuojančių vaizdų ir jų aprašymų. Mokymosi metu modelis ne įsimena konkrečius vaizdus, bet išmoksta atpažinti statistinius ryšius tarp vaizdų elementų, stilių, koncepcijų ir tekstinių aprašymų.

Kai modelis gauna užklausą (pavyzdžiui, tekstinį aprašymą), jis pradeda nuo atsitiktinio „triukšmo“ ir, remdamasis išmoktomis taisyklėmis bei asociacijomis, palaipsniui transformuoja šį triukšmą į vaizdą, atitinkantį užklausą. Nors modelis remiasi milžiniška egzistuojančių vaizdų analize – išmoktais raštais, stiliais ir sąryšiais, – galutinis sugeneruotas vaizdas yra techniškai naujas: tai unikali išmoktų elementų kombinacija, o ne tiesioginė jau egzistuojančio vaizdo kopija ar koliažas. Vis dėlto šis „naujumas“ yra pagrįstas ankstesne kūryba.

„Viena vertus, DI sugeneruotas vaizdas yra techniškai unikalus pikselių rinkinys, kokio anksčiau nebuvo, o žmogus, pateikdamas užklausą (angl. prompt), įneša tam tikrą kūrybinį impulsą, idėją“, – svarsto KTU mokslininkas.

Kita vertus, pats DI modelis neturi sąmonės, intencijos ar gyvenimiškos patirties – elementų, kurie dažnai laikomi menininko kūrybos šerdimi. Jo „kūryba“ tėra statistinių dėsningumų, išmoktų iš žmonių sukurtų darbų, rezultatas.

Dr. Mantas Lukauskas
Dr. Mantas Lukauskas

„Mano nuomone, DI sugeneruotą vaizdą galima laikyti įrankio produktu, kurio originalumas ir meninė vertė labai priklauso nuo idėjos originalumo, žmogaus indėlio į užklausos formulavimą ir galutinio rezultato panaudojimo konteksto. Tai labiau žmogaus ir DI bendradarbiavimo rezultatas nei vien DI „kūryba“. Todėl vienareikšmiškai vadinti tokius vaizdus originaliais meno kūriniais kol kas sudėtinga, ypač lyginant juos su tradicine žmogaus kūryba“, – sako jis.

Stiliaus imitavimas – kūrybinės išraiškos forma

M. Lukauskas pasakoja, kad nuotraukų perdirbimas (angl. remix) dažniausiai reiškia tiesioginį egzistuojančio kūrinio ar jo dalių paėmimą ir modifikavimą – pavyzdžiui, sukuriant koliažą, pakeičiant spalvas ar pridedant naujų elementų. Čia dirbama su konkrečiais egzistuojančio kūrinio pikseliais ar struktūra, todėl toks darbas laikomas išvestiniu kūriniu.

DI generuojami vaizdai (idealiu atveju) nėra vieno konkretaus kūrinio perdirbiniai. Jie kuriami remiantis išmoktais dėsningumais ir stiliais, apibendrintais iš daugybės egzistuojančių vaizdų. DI tarsi „supranta“ tam tikro stiliaus esmę – pavyzdžiui, „Ghibli“ būdingas linijas, spalvų paletę ar atmosferą – ir ją pritaiko kurdamas naują turinį.

„Mažesnė teisinė rizika kyla tada, kai DI sugeneruotas vaizdas tik imituoja stilių ar estetiką, bet nekopijuoja konkrečių autorinėmis teisėmis saugomų elementų – pavyzdžiui, unikalių personažų, tokių kaip Totoro, specifinių siužetų ar kompozicijų. Pats stilius dažniausiai nėra saugomas autorinėmis teisėmis. Todėl „Studio Ghibli“ estetikos imitavimas greičiausiai nebūtų laikomas pažeidimu, o veikiau kūrybine išraiška, įkvėpta to stiliaus“, – pastebi jis.

KTU mokslininko teigimu, galimas pažeidimas kyla tada, kai DI sugeneruotas vaizdas yra labai panašus (angl. substantially similar) į konkretų, autorinėmis teisėmis saugomą kūrinį. Tai gali nutikti, jei DI modelis netyčia „įsiminė“ ir atkūrė dalį mokymosi duomenų arba jei užklausa buvo labai specifinė, tiesiogiai nurodanti kopijuoti konkretų elementą. Jei rezultatas aiškiai atpažįstamas kaip konkretaus filmo kadras ar personažas, tai jau reikštų didelę autorinių teisių pažeidimo riziką.

„Verta pastebėti, kad naujausi DI modeliai, tokie kaip „OpenAI“ vystomi produktai, jau integruoja tam tikras apsaugos priemones. Nors jie dažnai geba sėkmingai generuoti vaizdus pagal pageidaujamą stilių (pvz., tam tikro animacinio filmo estetiką), bandant sugeneruoti konkrečius, autorinėmis teisėmis saugomus personažus ar elementus, modelis neretai atsisako vykdyti užklausą“, – sako jis.

Asociatyvi nuotrauka
Asociatyvi nuotrauka

Tokiu atveju vartotojui pateikiamas pranešimas, kad užklausa negali būti įvykdyta, nes ji pažeistų autorinių teisių politiką. Tai rodo DI kūrėjų pastangas bent iš dalies spręsti autorinių teisių klausimus ir sumažinti akivaizdžių pažeidimų riziką. Vis dėlto ši sistema nėra tobula, o stiliaus imitavimas dažniausiai išlieka neuždraustas.

Atsakomybė tenka pačiam naudotojui

M. Lukauskas atkreipia dėmesį, kad tiek ES, tiek JAV autorinių teisių įstatymai orientuoti į žmogaus kūrybą. Tad pagal šiuo metu vyraujančią praktiką (pavyzdžiui, JAV Autorių teisių biuro sprendimus), DI sugeneruoti vaizdai, prie kurių žmogus prisidėjo tik įvesdamas paprastą tekstinę užklausą, nelaikomi saugotinais – tokiais atvejais trūksta būtino žmogaus kūrybinio indėlio.

„Tačiau jei naudotojas reikšmingai įsitraukia – redaguoja, perkuria ar sujungia kelis DI sukurtus elementus į sudėtingesnį kūrinį – toks indėlis jau gali būti pripažintas autoriniu ir įgyti teisinę apsaugą“, – pažymi jis.

KTU mokslininkas atkreipia dėmesį, kad atsakomybė už DI sugeneruotą turinį gali tekti pačiam naudotojui – ypač tuomet, kai jis tokį turinį platina viešai, pavyzdžiui, internete ar komerciniais tikslais. Problema kyla ne dėl paties stiliaus imitavimo, o tada, kai sugeneruotas vaizdas pernelyg primena saugomą personažą, sceną ar kitą originalų kūrinio elementą ir taip pažeidžia autorines teises. Jei turinys kuriamas tik asmeniniam naudojimui, teisinė rizika mažesnė, tačiau naudotojas prisiima atsakomybę už jo teisėtumą.

M. Lukausko teigimu, sparčiai tobulėjantis DI turės didžiulį ir daugialypį poveikį, ypač kūrybinėms industrijoms – jis ne tik atvers naujas galimybes, bet ir kels nemažai iššūkių.

Asociatyvi nuotrauka
Asociatyvi nuotrauka

„Gali sumažėti poreikis tam tikroms standartinės fotografijos (angl. stock photography) rūšims, ypač generiniams vaizdams. Kita vertus, fotografai galės naudoti DI kaip įrankį idėjoms generuoti, vaizdams redaguoti ar kurti visiškai naujo tipo vizualinį meną. Unikali, meninė fotografija išliks vertinga“, – pažymi jis.

DI padės greičiau vizualizuoti idėjas, kurti prototipus ir generuoti variacijas. Tai gali „demokratizuoti“ kūrybą, leidžiant žmonėms be specifinių įgūdžių įgyvendinti savo vizijas. Tačiau kartu kils klausimų dėl autorystės, originalumo ir teisių tų menininkų, kurių stilius imituojamas. Pasak M. Lukausko, gali keistis ir kūrinio vertės suvokimas – rankų darbo, autentiška kūryba gali tapti dar labiau vertinama.

„DI leis dideliu mastu kurti personalizuotą reklaminį turinį, generuoti produktų vizualizacijas ir virtualius modelius. Kaip rodo „H&M“ pavyzdys – kai bendrovė paskelbė planuojanti sukurti skaitmeninius savo modelių klonus – tai mažina kaštus ir didina lankstumą. Tokie pokyčiai keis reklamos kūrimo procesus – kai kuriose srityse gali sumažėti poreikis tradicinėms fotosesijoms ar net modeliams“, – pastebi jis.

KTU mokslininkas pabrėžia, kad prie šių pokyčių teks prisitaikyti ne tik kūrėjams, bet ir verslui bei teisinei sistemai. „H&M“ pavyzdys rodo, jog verslas aktyviai ieško būdų, kaip integruoti šias technologijas siekiant didinti efektyvumą.