Be to, nustatyta, kad depresija sergantiems asmenims būdingas padidėjęs balso dažnio netolygumas (angl. jitter) ir amplitudės svyravimai (angl. shimmer), taip pat sumažėjęs harmonikų ir triukšmo santykis (HNR). Tai rodo balso stygų veiklos nestabilumą, kuris gali pasireikšti kaip lengvai virpanti kalba.
„Vis dėlto visi šie rodikliai yra labai subtilūs ir paprastai lieka nepastebėti žmogaus ausiai. Moksliškai kalbant, depresijos akustinį parašą sudaro sudėtingas makroskopinių ir mikroskopinių balso požymių derinys“, – sako M. Yousufi.
Perpranta skirtingas kalbas
KTU profesoriaus teigimu, itin svarbu tai, kad modeliai, apmokyti naudojant vieną duomenų rinkinį, gebėjo atpažinti depresiją ir kituose rinkiniuose. Tai tiesiogiai sprendžia vieną pagrindinių šios srities iššūkių – modelių gebėjimą generalizuoti, t. y. veiksmingai veikti ne tik su mokymo duomenimis, bet ir naujose, modeliui nepažįstamose populiacijose.
„Tyrimo rezultatai svarbūs ir tuo, kad rodo, jog naudojant atrinktus, keliais metodais patvirtintus (konsensusinius) akustinius požymius galima pasiekti bent dalinį modelių perkėlimą iš anglų į mandarinų kalbą ir atvirkščiai“, – dalijasi jis.
Pavyzdžiui, modeliai, apmokyti su gausesniu ir įvairesniu E-DAIC (anglų kalbos) duomenų rinkiniu, MODMA (mandarinų kalbos) rinkinyje pasiekė panašius ar net geresnius rezultatus nei pačiame E-DAIC rinkinyje. Tai rodo, kad egzistuoja universalūs, nuo kalbos nepriklausomi depresijos biožymenys.
„Nors buvo fiksuotas našumo sumažėjimas (angl. domain loss), ypač perkeliant modelius iš mažesnio (MODMA) į didesnį ir sudėtingesnį (E-DAIC) rinkinį, pats sėkmingo perkėlimo faktas atveria galimybes kurti praktiškai pritaikomas depresijos atpažinimo sistemas, veikiančias platesnėje klinikinėje aplinkoje“, – sako M. Yousufi.
Ne visi balso pokyčiai reiškia depresiją
Pagrindinis iššūkis nustatant depresiją iš balso yra tai, kad mašininio mokymosi modeliai, nors ir pasiekia gerų rezultatų viename duomenų rinkinyje, dažnai prasčiau veikia su naujais kalbėtojais, kitomis kalbomis ar naudojant skirtingą įrašymo įrangą. Tokiais atvejais DI neretai išmoksta ne universalių depresijos požymių, o konkrečiam duomenų rinkiniui būdingų artefaktų.