Pereiti prie turinio
ieškoti

A. Qurthobi daktaro disertacijos „Giliais neuronų tinklais pagrįstas garso anomalijų aptikimo triukšmingoje akustinėje aplinkoje metodas“ gynimas

Disertacijos gynimas

Autorius, institucija: Ahmad Qurthobi, Kauno technologijos universitetas

Mokslo sritis, kryptis: technologijos mokslai, informatikos inžinerija, T007

Mokslinis vadovas: prof. dr. Rytis Maskeliūnas (Kauno technologijos universitetas, technologijos mokslai, informatikos inžinerija, T007)

Informatikos inžinerijos mokslo krypties disertacijos gynimo taryba:
prof. dr. Renaldas Urniežius (Kauno technologijos universitetas, technologijos mokslai, informatikos inžinerija, T007) – pirmininkas
prof. dr. Nikolaj Goranin (Vilniaus Gedimino technikos universitetas, technologijos mokslai, informatikos inžinerija, T007)
doc. dr. Zenun Kastrati (Linėjaus universitetas, Švedija, technologijos mokslai, informatikos inžinerija, T007)
prof. dr. Renaldas Raišutis (Kauno technologijos universitetas, technologijos mokslai, matavimų inžinerija, T010)
prof. dr. Dmitrij Šešok (Vilniaus Gedimino technikos universitetas, technologijos mokslai, informatikos inžinerija, T007)

Disertacijos gynimas vyks Kauno technologijos universiteto Rektorato salėje (K. Donelaičio g. 73-402, Kaunas)

Su disertacija galima susipažinti Kauno technologijos universiteto bibliotekoje (Gedimino g. 50, Kaunas) ir internete: A. Qurthobi el. disertacija.pdf

 

© A. Qurthobi, 2026 „Disertacijos tekstą draudžiama kopijuoti, platinti, išleisti, viešai skelbti, įskaitant padarymą viešai prieinamu kompiuterių tinklais (internete), atgaminti bet kokia forma ir priemonėmis, įskaitant, bet neapsiribojant, elektroniniais, mechaniniais ar kitais būdais. Vadovaujantis Lietuvos Respublikos autorių teisių ir gretutinių teisių įstatymo 25 str. 1 dalimi, asmuo su negalia, kuriam kyla sunkumų perskaityti internete skelbiamos disertacijos dokumentą, ir kiek tai pateisinama konkrečia negalia, su prašymu dėl dokumento pateikimo kita forma turi kreiptis el. p. doktorantura@ktu.lt.“

 

Anotacija: Šioje disertacijoje nagrinėjamas patikimos garso klasifikacijos iššūkis įvairiose akustinėse aplinkose, kuriose foninis triukšmas ir signalo kintamumas mažina atpažinimo tikslumą. Tyrimo tikslas – sukurti patikimą metodą, leidžiantį aptikti ir klasifikuoti neįprastus ir aplinkos garsus realaus pasaulio scenarijuose. Pagrindinės užduotys apima laiko ir dažnio savybių palyginimą, pažangių giliųjų mokymosi sistemų integravimą ir jų veikimo vertinimą pramoninėse, miesto ir gamtinėse garso aplinkose. Šio darbo naujumas yra jo tarpdisciplininis požiūris, naudojant tris duomenų rinkinius (MIMII, ESC50 ir FSC22), ir hibridinių architektūrų, jungiančių pasikartojančius neuroninius tinklus (GRU ir LSTM) su moderniais pagrindais, tokiais kaip EffNet ir SWinT, kūrimas. Integruojant konvoliuojamaisiais arba transformatoriaus tinklais išgautas erdvinės reprezentacijas su laiko modeliavimu, siūlomi modeliai efektyviau fiksuoja sekvencines priklausomybes triukšmingose garso scenose. Metodikoje naudojami suvokimo motyvuoti atvaizdai (mel-spektrogramos, MFCC ir chroma-STFT) ir griežtas 5 kartų kryžminio patvirtinimo protokolas. Eksperimentai, atlikti naudojant aukštos našumo skaičiavimo infrastruktūrą, užtikrina atkuriamumą ir patikimumą. Veikimas vertinamas naudojant tikslumą, F1-rezultatą ir AUC. Rezultatai rodo, kad LSTM ir SWinT derinys, ypač su mel-spektrogramos funkcijomis, pasiekia geriausią veikimą, siekdamas 98,9 % MIMII, 90,8 % ESC50 ir 82,8 % FSC22.

2026 m. balandžio 28 d. 10:30

Kauno technologijos universiteto Rektorato salė (K. Donelaičio g. 73-402, Kaunas)

Įtraukti į iCal
Pasiūlyk įvykį!