21. marec 2024
Sistem strojnega učenja, usposobljen na milijonih človeških zvočnih posnetkov, obeta odkrivanje COVID-19 in tuberkuloze.
Avtor: Mariana Lenharo
Skupina pod vodstvom Googlovih znanstvenikov je razvila orodje za strojno učenje, ki lahko z ocenjevanjem zvokov, kot sta kašelj in dihanje, pomaga pri odkrivanju in spremljanju zdravstvenih težav. Sistem umetne inteligence (AI)*1, ki je bil usposobljen na milijonih zvočnih posnetkov človeških zvokov, bodo zdravniki nekoč lahko uporabljali za diagnosticiranje bolezni, kot sta COVID-19 in tuberkuloza, ter za ocenjevanje, kako dobro delujejo pljuča posameznika.
To ni prvi primer, ko raziskovalna skupina raziskuje uporabo zvoka kot biomarkerja bolezni. Ta koncept se je uveljavil med pandemijo COVID-19, ko so znanstveniki odkrili, da je mogoče bolezen dihal zaznati s kašljem*2.
Novost Googlovega sistema, imenovanega Health Acoustic Representations (HeAR), je obsežen nabor podatkov, na katerem je bil usposobljen, in dejstvo, da ga je mogoče natančno prilagoditi za izvajanje več nalog.
Raziskovalci, ki so o orodju poročali v začetku tega meseca v predtisku*1 , ki še ni bil recenziran, pravijo, da je še prezgodaj govoriti o tem, ali bo HeAR postal komercialni izdelek. Za zdaj nameravajo zainteresiranim raziskovalcem omogočiti dostop do modela, da ga bodo lahko uporabljali pri svojih raziskavah. “Naš cilj v okviru projekta Google Research je spodbuditi inovacije na tem nastajajočem področju,” pravi Sujay Kakarmath, produktni vodja pri Googlu v New Yorku, ki je sodeloval pri projektu.
Kako usposobiti svoj model
Večina orodij umetne inteligence, ki se razvijajo na tem področju, se usposablja na zvočnih posnetkih – na primer kašlja -, ki so povezani z zdravstvenimi informacijami o osebi, ki je te zvoke izdala. Posnetki so lahko na primer označeni tako, da navajajo, da je imela oseba v času snemanja bronhitis. Orodje v postopku usposabljanja, ki se imenuje nadzorovano učenje, poveže značilnosti zvokov z oznako podatkov.
“V medicini tradicionalno uporabljamo veliko nadzorovanega učenja, kar je odlično, saj imamo klinično potrditev,” pravi Yael Bensoussan, laringologinja na Univerzi Južna Florida v Tampi. “Slaba stran je, da je s tem res omejen nabor podatkov, ki jih lahko uporabljate, saj je na voljo premalo komentiranih naborov podatkov.”
Namesto tega so Googlovi raziskovalci uporabili samonadzorovano učenje, ki temelji na neoznačenih podatkih. Z avtomatiziranim postopkom so iz javno dostopnih videoposnetkov na YouTubu pridobili več kot 300 milijonov kratkih zvočnih posnetkov kašljanja, dihanja, grlenja in drugih človeških zvokov.
Vsak posnetek je bil pretvorjen v vizualno predstavitev zvoka, imenovano spektrogram. Nato so raziskovalci blokirali segmente spektrogramov, da bi se model naučil napovedovati manjkajoče dele. To je podobno, kot so velik jezikovni model, na katerem temelji klepetalni robot ChatGPT, naučili napovedovati naslednjo besedo v stavku, potem ko so ga usposobili na neštetih primerih človeških besedil. S to metodo so raziskovalci ustvarili tako imenovani temeljni model, za katerega pravijo, da ga je mogoče prilagoditi za številne naloge.
Učinkovit učenec
V primeru HeAR ga je Googlova ekipa prilagodila za odkrivanje COVID-19, tuberkuloze in lastnosti, kot je, ali oseba kadi. Ker je bil model usposobljen na tako širokem razponu človeških zvokov, so ga morali raziskovalci za natančnejšo prilagoditev nahraniti le z zelo omejenimi nabori podatkov, označenimi s temi boleznimi in značilnostmi.
Na lestvici, na kateri 0,5 pomeni model, ki ni boljši od naključne napovedi, 1 pa pomeni model, ki vsakič natančno napove, je HeAR dosegel 0,645 in 0,710 točke za odkrivanje COVID-19, odvisno od tega, na katerem podatkovnem nizu je bil preizkušen – kar je boljša uspešnost od obstoječih modelov, ki so bili usposobljeni na govornih podatkih ali splošnem zvoku. Za tuberkulozo je bila ocena 0,739.
Dejstvo, da so bili prvotni učni podatki tako raznoliki – z različno kakovostjo zvoka in človeškimi viri – pomeni tudi, da so rezultati posplošljivi, pravi Kakarmath.
Ali Imran, inženir na Univerzi Oklahoma v Tulsi, pravi, da je raziskava pomembna zaradi velike količine podatkov, ki jih uporablja Google. “To nam daje gotovost, da je to zanesljivo orodje,” pravi.
Imran vodi razvoj aplikacije z imenom AI4COVID-19, ki se je izkazala za obetavno pri razlikovanju kašlja COVID-19 od drugih vrst kašlja*3. Njegova ekipa namerava zaprositi za odobritev pri ameriški Upravi za hrano in zdravila (FDA), da bi lahko aplikacija sčasoma prišla na trg; trenutno išče finančna sredstva za izvedbo potrebnih kliničnih preskušanj. Do zdaj še nobeno orodje, ki ga je odobrila FDA, ne omogoča diagnosticiranja s pomočjo zvokov.
Bensoussan pravi, da je področje zdravstvene akustike ali avdiomike obetavno. “Znanost o akustiki obstaja že desetletja. Drugače pa je, da imamo zdaj z umetno inteligenco in strojnim učenjem na voljo sredstva za zbiranje in analizo številnih podatkov hkrati.” Soustvarja raziskovalni konzorcij, ki se osredotoča na raziskovanje glasu kot biomarkerja za spremljanje zdravja.
Pravi, da je “ogromen potencial ne le za diagnosticiranje, temveč tudi za presejanje” in spremljanje. “Ne moremo vsak teden ponavljati slikanj ali biopsij. Zato je glas zelo pomemben biomarker za spremljanje bolezni,” dodaja. “Ni invaziven in ne zahteva veliko sredstev.”
doi: https://doi.org/10.1038/d41586-024-00869-0
Reference
-
Baur, S. et al. Preprint at arXiv https://doi.org/10.48550/arXiv.2403.02522 (2024).
-
Santosh, K. C., Rasmussen, N., Mamun, M. & Aryal, S. PeerJ. Comput. Sci. 8, e958 (2022).
-
Imran, A. et al. Inform. Med. Unlocked 20, 100378 (2020).
Vir: https://www.nature.com/articles/d41586-024-00869-0
* * *
Torej, tako bi lahko rekel kakšen teoretik zarote:
1. Morali bomo imeti najhitrejši možni dostop do informacij, zato bomo namestili 5G, 6G, 7G … POVSOD.
2. Na to infrastrukturo bomo namestili vse možne senzorje za spremljanje v realnem času (video, zvočni, toplotni, spektralni) …
3. Razvili, izboljšali in izpopolnili bomo algoritme za računalniške programe in jih poimenovali umetna inteligenca (AI).
4. Na podlagi podatkov iz senzorjev bo umetna inteligenca takoj ugotovila (med drugim) NAŠE zdravstvene težave in določila ustrezno zdravljenje (npr. cepivo mRNA), ki ga je treba takoj uporabiti, ter o tem obvestila dežurno ekipo, ki bo OBVEZNO posredovala, saj vas ni treba več ničesar spraševati.
5. Kdor bo dvomil v odločitve umetne inteligence, ga bomo razglasili za širitelja dezinformacij in ga kot takega preganjali (odstranili), saj nihče ne sme dvomiti v znanstvenike, ki delajo za podjetje, katerega prva prioriteta je izključno dobrobit človeštva (npr. kot je Google).
6. Za boljše obveščanje ljudi bodo imeli vsi nalogo promovirati vse napredne tehnologije, ki so tu v korist ljudi, in na ta način bodo zatrli napačne, lažne in škodljive informacije. Po potrebi bomo na primer ljudem vsak dan povedali, kolikokrat je bila umetna inteligenca uspešna (in jih ne bomo obremenjevali s tem, ali je šlo za resnične, lažne ali le teoretične primere na papirju)
7. Ljudi je treba obvestiti (in jih občasno opomniti), da je vse to v njihovo dobro, da je vse to brezplačno (če ne štejemo njihovega davčnega denarja), da so bili doseženi ogromni prihranki (npr. v medicini ne bomo več potrebovali drage diagnostične opreme, npr. za laboratorije, radiologijo, nevrologijo itd,
da ne omenjam, koliko bomo prihranili pri plačah vseh zdravnikov, zdravstvenega osebja in drugih zaposlenih v zdravstvu in okoli njega, ki jih ne bomo več potrebovali). Farmacevtsko industrijo bomo obdržali le (začasno) in to le, dokler ne bomo v VSE ljudi vsadili čipov in nanotehnologije.
8. Umetna inteligenca bo tudi urejala, kdaj, koliko in kako dolgo se bo nebo nad nami prašilo, da bi se izognili podnebnim in vsem drugim spremembam, ki bi lahko vplivale na naše telesno in mentalno zdravje (zlasti mentalno, saj bi bilo, če bi kdo razmišljal samostojno, to zelo sebično in bi samo pokazalo, kako zelo ne dela za skupno dobro).
9. Verjetno bi moral biti 1 % svetovnega prebivalstva (najbogatejši) izvzet iz vsega naštetega, saj ne bi bilo lepo, če bi zaradi tega, ker se ukvarjamo z njimi, trpelo preostalih 99 % ljudi na svetu.
Verjetno bi se dalo povedati še več, vendar je težko pomisliti na vse, kar si lahko izmisli teoretik zarote.
Seveda je bilo vse to napisano v skladu z zakonsko ureditvijo o razširjanju pravočasnih in točnih informacij, da bi navadni ljudje lahko pravočasno prepoznali, kdo (ne) želi delati za njihovo dobro.
* * *
ps – ali je AI tudi začela pisati o sebi in se promovira (brez novinarjev) … 👇👇👇