Pereiti prie turinio
ieškoti
Ryškiai oranžiniame fone trys susijungę kubeliai su tekstu „9 Pramonė, inovacijos ir infrastruktūra“. Pavaizduojamas technologinės pažangos ir infrastruktūros vystymo tikslas.
Garstyčių spalvos fone baltas begalybės simbolis su rodykle viduje ir tekstu „12 Atsakingas vartojimas ir gamyba“. Vaizduojamas atsakingo išteklių naudojimo ir tvarios gamybos tikslas.

Dirbtinio intelekto akimis: kaip technologijos mokosi „matyti“?

Svarbiausios | 2026-01-05

Kompiuteris, skenuojantis žmogaus kūną, ar robotas, padedantis atrinkti brokuotas prekes – tokios technologijos šiandien jau nestebina nei vieno. O ką manytumėte, jei televizoriai skaitytų žmogaus kūną ir paklaustų, ar mums viskas gerai? Arba rankos mostu šviesos jungiklis įjungtų arba išjungtų šviesą, o judesio jutikliai stebėtų vyresnius artimuosius ir, vos tik nutikus nelaimei, praneštų tai jums?

Kauno technologijos universiteto (KTU) Elektros ir elektronikos fakulteto (EEF) profesorius dr. Vidas Raudonis įsitikinęs, kad netolimoje ateityje tokios technologijos galėtų papildyti žmonių gyvenimus.

KTU profesorius Vidas Raudonis
KTU profesorius Vidas Raudonis

„Mes patys galėsime regėti daugiau, nes neapsiribosim tik regimąją šviesa“, – teigia V. Raudonis.

Visa tai ir panašūs dalykai tampa įmanomi dėka kompiuterinės regos – dirbtiniu intelektu (DI) paremtos technologijos, leidžiančios „mašinoms“ (plačiąja to žodžio prasme) regėti jas supantį pasaulį ir ją suvokti per įprastas mums vaizdo kameras. „Dar daugiau – ne tik suvokti, bet ir priimti savarankiškus sprendimus remiantis vaizdine informacija“, – pastebi KTU profesorius.

Technologijų plėtra pramonėje – sparti

Kompiuterinė rega, pasak V. Raudonio, šiandien taikoma labai plačiai – nuo industrinės pramonės iki žmonių sekimo viešose erdvėse. Pavyzdžiui, Kinijoje gyventojai stebimi per vaizdo kameras, o už netinkamą elgesį sulaukia nuobaudų.

Gamybos pramonėje, profesoriaus teigimu, šios technologijos diegiamos labai paprastai. „Jau dabar egzistuoja produktų, kurie būdami ne didesni nei internetinės kameros, savyje turi integruotus kompiuterius. Šie mažyčiai kompiuteriai gali 24 valandas per parą, 7 dienas per savaitę analizuoti produkcijos vaizdus ir aptikti defektus“, – sako V. Raudonis.

Lietuvos rinkoje dažniausiai naudojamos defektų aptikimo technologijos baldų gamybos pramonėje. Kompiuterinės regos technologijomis paremti sprendimai taip pat vystomi ir kitose srityse.

„Tarkime, kompiuterinė rega padeda roboto rankoms surasti konvejeriu judančių objektų sugriebimo taškus. Tai jau tapo tam tikra norma“, – tikina KTU profesorius.

Medicinoje būtinas žmonių pasitikėjimas

Šiuo metu V. Raudonis pats šias technologijas dažniausiai taiko žmogaus reprodukcijos srityje, kur reikia automatiškai nustatyti inkubatoriuje auginto embriono kokybę, iš histologinių vaizdų nustatyti gimdos receptyvumą ir įvertinti spermatozoidų sveikatą iš vaizdo medžiagos.

„Visgi medicinos pramonėje, kitaip nei kitose srityse, šių technologijų naudojimas nėra toks paprastas. Tam reikia gauti atitinkamus sertifikatus, kuriuos norint gauti tenka pereiti daugybę testavimų modeliuojant, po to atlikti bandymus su gyvūnais, dar vėliau – su dedikuota žmonių grupe“, – teigia KTU profesorius.

Tačiau net ir turint sertifikatą, anot jo, žmonės dažnai mieliau renkasi ligai diagnozuoti žmogų, t. y. gydytoją. „Tad kompiuterine rega paremtų technologijų taikymas medicinoje reikalauja ir žmonių pasitikėjimo, kurį reikia užsitarnauti“, – tikina V. Raudonis.

Kas yra kompiuterio „akis“?

KTU profesorius pasakoja, kad dirbtinis intelektas, kuriuo ir paremtos kompiuterinės regos technologijos, sąmoningai nesuvokia iš kur atkeliauja signalas. Tarp jų ir žmogaus smegenys uždarytos tamsioje, drėgnoje erdvėje, vadinama kaukole, neatsirenka iš kur ateina signalas.

Asociatyvi nuotrauka
Asociatyvi nuotrauka

„Visi signalai biologinėje sistemoje yra konvertuojami į elektrocheminį impulsą, kuris keliauja neuroniniais raizgalynais. Tik dėka sąmonės mes po to atsirenkame, kad iš užmerktos akies signalas vis tiek ateina, bet iš jo mažai naudos. Lygiai kaip ir biologinėje sistemoje, mes dirbtiniam intelektui duodame ne vaizdą, garsą ar tekstą, o skaičius (analogija į elektrocheminį impulsą), kuriais ir operuoja DI modeliai“, – sako V. Raudonis.

DI išmoksta tam tikrą skaičių kombinaciją, kuri yra būdinga, pavyzdžiui, vaizdams su kačiukais. Tuo tarpu vaizdai su šuniukais pasižymi kitokia skaičių kombinacija.

„DI išmoksta atpažinti tas skaičių kombinacijas, kurias užregistruoja vaizdo kameros. Tai tam tikra prasme galėtų būti traktuojama kaip kompiuterio akys“, – tikina V. Raudonis.

Kol kas pranašesnis žmogus

Pagrindinis iššūkis mokant DI modelius, pasak KTU profesoriaus – pasaulio tikroviškumas, jo nenuspėjamumas, formų, spalvų ir dydžių įvairovė.

„Viskas, kas mums, biologinėms būtybėms, kelia nuostabą, susižavėjimą, DI modeliams – dar viena iššūkius kelianti įvairovė“, – sako V. Raudonis.

Visgi DI pranašesnis prieš žmogų tuo, kad gali nesustodamas dirbti nuolat. „Kai žmogui reikia pamiegoti, nueiti į tualetą ar pavalgyti, DI modelis ir toliau dirba. Lygiai taip pat efektyviai, lygiai taip pat greitai. Be to, jeigu turi gerus skaičiavimo resursus, DI paremti sprendimai atliekami greičiau nei tai padarytų žmogus“, – pastebi profesorius.

Tačiau jeigu pasikeičia produkcija, kompiuterinę sistema sunkiau adaptuoti – čia pasireiškia žmogaus privalumai. Žmogus lengviau ir paprasčiau adaptuojasi prie pasikeitusių sąlygų.

„Žmogaus regėjimo sistema evoliucionavo daugiau 2 milijonus metų. Nemanau, kad šiuolaikinės kompiuterinės regos technologijos gali būti tikslesnės nei žmogus. Kol kas“, – tikina KTU EEF profesorius V. Raudonis.