^
A
A
A

Stemme som analyse: Tidlige signaler på kreft og godartede lesjoner

 
Alexey Kryvenko, Medisinsk anmelder
Sist anmeldt: 18.08.2025
 
Fact-checked
х

Alt iLive-innhold blir gjennomgått med medisin eller faktisk kontrollert for å sikre så mye faktuell nøyaktighet som mulig.

Vi har strenge retningslinjer for innkjøp og kun kobling til anerkjente medieområder, akademiske forskningsinstitusjoner og, når det er mulig, medisinsk peer-evaluerte studier. Merk at tallene i parenteser ([1], [2], etc.) er klikkbare koblinger til disse studiene.

Hvis du føler at noe av innholdet vårt er unøyaktig, utdatert eller ellers tvilsomt, velg det og trykk Ctrl + Enter.

12 August 2025, 08:13

Forskere fra Oregon Health & Science University analyserte taleopptak fra det nye, offentlig tilgjengelige datasettet Bridge2AI-Voice og fant en enkel akustisk funksjon som kan avsløre stemmebåndspatologi. Vi snakker om forholdet mellom harmoniske og støy (HNR) – forholdet mellom «musikalske overtoner» og støy. Nivået og variasjonen skilte stemmene til personer med strupekreft og godartede lesjoner fra friske og noen andre stemmeforstyrrelser. Effekten var spesielt tydelig hos cisgenderte menn; statistisk signifikans var ikke nok for kvinner – forfatterne skylder på den lille utvalgsstørrelsen og etterlyser en utvidelse av dataene. Arbeidet ble publisert som en kort rapport i Frontiers in Digital Health.

Bakgrunn for studien

  • Hvorfor i det hele tatt lete etter «stemmemarkører»? Heshet er en vanlig klage. Årsakene er varierte: fra forkjølelse og refluks til knuter/polypper og strupekreft. For tiden er veien til diagnose et besøk hos en ØNH-spesialist og en endoskopi (et kamera i nese/hals). Det er nøyaktig, men ikke alltid raskt tilgjengelig og er ikke egnet for egenmonitorering hjemme. Forhåndsscreening er nødvendig: en enkel måte å forstå hvem som bør oppsøke lege først.
  • Hva er en stemmebiomarkør? Tale er et signal som enkelt kan tas opp på en telefon. «Mønsteret» kan brukes til å bedømme hvordan stemmebåndene vibrerer. Lesjoner gjør vibrasjonene ujevne: mer «støy» og mindre «musikk».
  • Hvorfor nye datasett er viktige. Tidligere var slike arbeider avhengige av små, «hjemmelagde» prøver – modellene var skjøre. Bridge2AI-Voice er et stort, multisenter, etisk innsamlet sett med lydopptak knyttet til diagnoser. Det ble opprettet som et «felles testområde» for endelig å trene og teste algoritmer på store og heterogene data.
  • Hvor ligger de største vanskelighetene?
    • Stemmen endres på grunn av mikrofonen, romstøy, kulde, røyking, språk, kjønn og alder.
    • Det er tradisjonelt mindre kvinnedata, og den kvinnelige stemmen er høyere i frekvens – beregninger oppfører seg annerledes.
    • Ingen «hjemmetest» kan erstatte en undersøkelse eller stille en diagnose – i beste fall hjelper den med å avgjøre: «er det nødvendig å oppsøke en ØNH-spesialist raskt?»
  • Hvorfor trenger klinikken og pasientene dette? Hvis personer med høy risiko for lymfeknuter/svulster kan prioriteres ved hjelp av en kort avtale, vil dette fremskynde diagnostiseringen, redusere unødvendige henvisninger og gi et verktøy for egenmonitorering mellom besøk (etter operasjon, under behandling).
  • Hvor dette bør føre: Til validerte telemedisinske applikasjoner/moduler som:
    1. skriv en tale i henhold til standarden (frase + uttrukket «aaa»),
    2. beregne grunnleggende funksjoner (HNR, jitter, shimmer, F0),
    3. gi en anbefaling om å kontakte en spesialist dersom profilen er alarmerende,
    4. opprettholde dynamikken etter behandlingen.

Ideen er enkel: «legg telefonen til øret til en ØNH-lege» – ikke for diagnose, men for ikke å gå glipp av de som trenger rask hjelp ansikt til ansikt.

Hva gjorde de egentlig?

  • Vi tok den første utgivelsen av det multisenterbaserte, etisk innsamlede Bridge2AI-Voice-datasettet, et flaggskipprosjekt i regi av NIH der stemmeopptak kobles til klinisk informasjon (diagnoser, spørreskjemaer osv.).
  • To analytiske prøver ble dannet:
    1. "larynxkreft / godartede lymfeknuter / frisk";
    2. "kreft eller godartede knuter" versus spasmodisk dysfoni og stemmebåndslammelse (andre vanlige årsaker til heshet).
  • Grunnleggende stemmetrekk ble identifisert fra standardiserte fraser: grunntone (F0), jitter, skimmer og HNR, og gruppene ble sammenlignet ved hjelp av ikke-parametrisk statistikk. Resultat: De mest stabile forskjellene var i HNR og F0, der HNR og dens variasjon best skilte godartede lesjoner fra både normen og strupekreft. Disse signalene var mer tydelige hos menn.

Hvorfor er dette viktig?

  • Tidlig screening uten sonde. Veien til diagnose er for tiden ofte nasoendoskopi og, ved mistanke, biopsi. Hvis enkle akustiske funksjoner kombinert med kunstig intelligens kan prioritere de som trenger endoskopi, vil pasientene komme raskere til en ØNH-spesialist, og unødvendige henvisninger vil bli redusert. Dette er et supplement, ikke en erstatning for legen.
  • Stordata for stemme. Bridge2AI-Voice er et sjeldent prosjekt der stemme samles inn ved hjelp av ensartede protokoller og kobles til diagnoser. Dataene er tilgjengelige for forskere via PhysioNet / Health Data Nexus. Dette akselererer utviklingen av pålitelige stemmebiomarkører i stedet for «mirakelapper» på små utvalg.

Hva er HNR?

Når vi snakker, vibrerer stemmebåndene og lager overtoner (harmoniske). Men vibrasjonen er aldri perfekt – det er alltid støy i signalet. HNR er rett og slett hvor mye mer «musikk» det er i stemmen enn «sus». Når stemmebåndene er skadet, blir vibrasjonen mindre jevn – det er mer støy, HNR faller, og sprangene (variabiliteten) øker. Dette er mønsteret forfatterne fanget opp.

Viktige ansvarsfraskrivelser

  • Dette er en pilotanalyse, en utforskende analyse: uten klinisk validering, med begrensninger på utvalget av kvinner – så effektene deres var ikke signifikante. Større og mer mangfoldige data og «steking» av modeller i forskjellige klinikker og på forskjellige språk er nødvendig.
  • Stemmen er en «flerverdig» ting: den påvirkes av forkjølelse, røyking, refluks, en mikrofon, støy i rommet. Enhver «hjemmetest» bør kunne ta hensyn til konteksten – og fortsatt fungere som et filter for en henvisning til en ØNH-spesialist, og ikke en klikkbar diagnose.

Hva skjer nå?

  • Utvid datasettet (inkludert for kvinner og aldre), standardiser oppgaver og akustikk (lesing av en frase, langvarig «aaa» osv.), prøv multimodale modeller (stemme + spørreskjemasymptomer/risikofaktorer).
  • Koble akustiske tegn til undersøkelsesresultater (endoskopi, stroboskopi) og dynamikk etter behandling – slik at HNR-profilen også kan brukes til overvåking.
  • Fortsett med «åpen vitenskap»: Bridge2AI-Voice publiserer allerede versjoner av datasettet og verktøyene – dette er en mulighet til raskt å nå ut til virkelige piloter i klinikker.

Konklusjon

Det er mulig å «høre» problemer med stemmebåndene fra stemmen – og kanskje henvise personen til riktig spesialist raskere. Foreløpig er det en fin pekepinn (HNR og dens variasjon), men takket være store mengder åpne data har stemmebiomarkører endelig en sjanse til å bli et pålitelig screeningsverktøy.

Kilde: Jenkins P. et al. Stemme som biomarkør: Utforskende analyse av godartede og ondartede stemmebåndslesjoner. Frontiers in Digital Health, 2025 (godkjent for publisering). Data — Bridge2AI-Voice (NIH/PhysioNet).

You are reporting a typo in the following text:
Simply click the "Send typo report" button to complete the report. You can also include a comment.