Pereiti prie turinio
ieškoti

Išmanus eismo valdymas: KTU studentas kuria aplinkos suvokimo modelį autonominėms sistemoms

Svarbiausios | 2025-06-26

Remiantis JAV nacionalinės greitkelių eismo saugumo administracijos (NHTSA) duomenimis, net 94 proc. eismo įvykių įvyksta dėl žmogaus pasirinkimo ar klaidos. Šis skaičius dažnai įvardijamas kaip vienas pagrindinių argumentų, kodėl būtina plėtoti autonomines transporto priemones. Ar technologija gali padaryti tai, ką ne visada sugebame mes – objektyviai, greitai ir nuosekliai vertinti situaciją?

Kauno technologijos universiteto (KTU) studentas Bartas Lisauskas įsitikinęs, kad gali. Jis vysto sistemą, kuri leistų kompiuterinei regai veikti efektyviai net tada, kai naudojami itin riboti skaičiavimo resursai.

Programų sistemų inžineriją bebaigiantis Bartas sako, kad nuo pat studijų pradžios ieškojo sprendimų, kurie turėtų praktinę vertę. Jį labiau domino ne teoriniai modeliai, o tai, kaip technologijos veikia realiomis sąlygomis. Šiandien tokios paieškos tampa vis aktualesnės – autonominės sistemos jau diegiamos ne tik transporte, bet ir pramonėje, logistikoje bei aptarnavimo sektoriuje.

Išmanus eismo valdymas miestuose

„Sukurti efektyvias ir saugias autonomines technologijas, kurios būtų naudingos realiame gyvenime, yra pakankamai nelengva užduotis, reikalaujanti nemažai laiko ir pastangų“, – sako B. Lisauskas.

Situacija gerėja, tačiau norint, kad šios technologijos būtų plačiai taikomos, būtina galvoti ir apie jų įgyvendinimo praktiką – tiek infrastruktūroje, tiek kasdienėse paslaugose. Viena iš sričių, kur, pasak jo, dar matomas neišnaudotas potencialas – tai išmanus eismo valdymas miestuose.

Aplinkos suvokimo modelis
Aplinkos suvokimo modelis

Autonominėms sistemoms reikia daugiau nei gebėjimo judėti – jos turi atpažinti aplinką, spręsti, kaip elgtis konkrečioje situacijoje ir tai padaryti greitai. Vienas svarbiausių jų komponentų – kompiuterinė rega. Ji leidžia sistemai stebėti, identifikuoti ir klasifikuoti objektus aplinkoje, pavyzdžiui, kitus automobilius, pėsčiuosius, kelio ženklus ar eismo juostas.

„Autonominės sistemos veikia remdamosi daugybe duomenų iš skirtingų šaltinių, tokių kaip jutikliai, kameros, radarai. Visa ši informacija turi būti apdorota ir integruota, kad sistema galėtų suprasti savo aplinką ir priimti sprendimus realiu laiku“, – aiškina KTU magistro studijas bebaigiantis studentas.

Jis pabrėžia, kad kompiuterinės regos sprendimai ne tik leidžia tiksliai matyti aplinką, bet ir padeda sistemai prisitaikyti prie dinamiškų situacijų. Tai ypač svarbu autonominėse transporto priemonėse ar robotizuotuose įrenginiuose, kurių veikimas turi būti ne tik techniškai tikslus, bet ir saugus.

„Žmogaus sprendimai dažnai būna paremti patirtimi ar emocijomis, tuo tarpu kompiuterinė rega, jei tinkamai įgyvendinta, gali užtikrinti nuoseklų situacijų vertinimą“, – priduria jis.

Rytis Maskeliūnas, šio mokslinio projekto vadovas ir KTU Informatikos fakulteto (IF) Programų inžinerijos katedros profesorius džiaugiasi, kad studijų metu studentai sprendžia realius, praktinius iššūkius naudodami pažangius dirbtinio intelekto metodus, o Barto projektas – puikus to pavyzdys.

Suvokia, naudodamas ribotus išteklius

Vienas iš pagrindinių iššūkių – kaip užtikrinti, kad aplinkos suvokimas būtų ne tik tikslus, bet ir įgyvendinamas ribotų išteklių sąlygomis. Šiam uždaviniui spręsti Bartas sukūrė semantinio segmentavimo modelį, pritaikytą efektyviam veikimui be galingos skaičiavimo įrangos.

Jo tikslas – suskirstyti vaizdą į atskiras kategorijas, tokias kaip kelias, automobilis, dangaus zona ar šaligatvis. Ši užduotis reikalauja didelio skaičiavimo pajėgumo, ypač jei siekiama aukšto tikslumo.

„Tokia sistema kuriama naudojimui ribotų resursų aplinkoje, kurioje nėra galingos įrangos ir visus skaičiavimus reikia atlikti greitai bei efektyviai“, – sako jis.

Prof. Rytis Maskeliūnas
Prof. Rytis Maskeliūnas

Modelis paremtas transformerių architektūra, papildyta dėmesio valdymo moduliu. Šis mechanizmas leidžia sistemai skirti daugiau skaičiavimo išteklių svarbiausioms vaizdo sritims, o mažiau – fonui ar nereikšmingiems elementams. Toks sprendimas leidžia padidinti efektyvumą neaukojant rezultatų tikslumo.

„Transformerių architektūra padeda efektyviai apdoroti duomenis, o kartu naudojamas dėmesio valdymas leidžia sistemai koncentruotis į svarbiausias vaizdo dalis. Tokia kombinacija suteikia geresnius rezultatus ribotų resursų sąlygomis“, – aiškina Bartas.

Pasak jo, pagrindinis iššūkis – rasti balansą tarp modelio našumo ir efektyvumo: „Daugelis esamų modelių veikia gerai, tačiau reikalauja daug resursų. Mano tikslas – sukurti sistemą, kuri būtų pakankamai lengva, kad ją būtų galima naudoti realiame įrenginyje, bet tuo pačiu pakankamai tiksli, kad ji būtų naudinga.“

R. Maskeliūnas pabrėžia, jog šis darbas apie efektyviai skaičiavimo išteklius naudojančią semantinę segmentaciją per transformeriais grįstas architektūras rodo ne tik techninį gylį, bet ir puikų praktinių diegimo apribojimų suvokimą – esminį intelektinių sistemų inžinerijos aspektą.

„Barto sprendimui nereikia nei galingo GPU klasterio, nei brangios GPU plokštės – sprendimas puikiai veikia sename kompiuteryje. O studento tyrimas papildo KTU plėtojamų dirbtinio intelekto inovacijų kryptį – dirbtinio intelekto integravimą su signalų apdorojimu, siekiant sukurti sistemas, kurios būtų ir protingos, ir efektyvios dinamiškoje realioje aplinkoje“, – teigia KTU profesorius.

Straipsnį „Efficient Transformer-Based Road Scene Segmentation Approach with Attention-Guided Decoding for Memory-Constrained Systems“ galite rasti čia.