Til hovedinnhold
Norsk English

Her er mikrofonen som kan sortere lyder og måle bråk

Slik ser det ut når lyden skal overvåkes på en byggeplass. Foto: Norsonic
Slik ser det ut når lyden skal overvåkes på en byggeplass. Foto: Norsonic
En ny og KI-basert lydmåler kan skille mellom gravemaskiner og måkeskrik. Slikt er det vanskelig å få kunstig intelligens til å forstå.

Vil du vite hvor mye bråk det er på en byggeplass? Da vil du måle lyden på gravemaskinen eller slagdrillen, men du vil ikke måle måkeskrik, trafikkstøy eller et helikopter som flyr forbi.

Nå kan en ny lydmåletjeneste gjøre akkurat det. Ved hjelp av kunstig intelligens – og det er slett ikke noen selvfølge, forklarer SINTEF-seniorforsker Femke B. Gelderblom.

Forvirrende for KI

– Lyd og kunstig intelligens er ganske umoden når vi sammenligner med det KI kan gjøre med bilder eller tekst. Audio er veldig vanskelig, selv om det er et greit konsept for oss mennesker å forstå. Det å forklare at en lyd er den samme som en likeens lyd fra større avstand, det kan fort forvirre en KI-modell!

Portrett av SINTEF-forsker Femke Gelderblom. Foto: SINTEF

Kunstig intelligens er mye mer umoden når den arbeider med lyd enn når den arbeider med bilder eller tekst, forklarer Femke B. Gelderblom. Foto: SINTEF

Men Gelderblom og kollegene hennes i SINTEF har fått det til. De har gjort et forskningsprosjekt sammen med Norsonic – et norsk firma som lager utstyr for å måle lyder og vibrasjoner. Resultatet er blitt et helt nytt produkt: NoiseTag. – Det er spennende å få forske på tema som blir til ekte produkter, sier hun.

Bort med måkeskrik

– Det som har vært vanskelig før, er at de som går gjennom dataene, må lytte på hvert enkelt opptak for å fjerne de måledataene som ikke er relevante for prosjektet, sier Karl Henrik Ejdfors hos Norsonic.

– Det typiske eksempelet er måkeskrik på en havn. I stedet for å lytte på måkeskrik og helikoptre, trener vi opp en modell på disse lydene og sier hvilke lyder som skal være med og hvilke som ikke skal være med i prosjektet. Så filtrerer modellen automatisk og fjerner de delene av målingene, forteller han.

Karl Henrik Ejdfors og Norsonic leverer måleutstyr blant annet på byggeplasser og i havner. (Foto: Norsonic)

Karl Henrik Ejdfors og Norsonic leverer måleutstyr blant annet på byggeplasser og i havner. Foto: Norsonic

Hører alt

Norsonic produserer måleutstyr blant annet til havner og til byggeplasser. Mikrofonene er kalibrert og standardisert for å fylle kravene til lovpålagt støymåling, blant annet i byggebransjen. Men mikrofonene får med seg all lyden på stedet.

– Når de monitorerer støy, ønsker de gjerne å vite hva som er «min» støy og hva som er «din» støy. Et byggeprosjekt blir veldig ofte liggende ved siden av en stor vei. Veien støyer jo, men det betyr ikke at byggeprosjektet ikke kan bygges fordi selve byggeprosjektet støyer for mye. Da er det godt å vite at denne støyen kommer fra veien, mens denne støyen er byggeprosjektet, sier Femke B. Gelderblom.

Lærer ikke så fort

Forskningen har gjort det mulig å lage modeller som er spesifikke for hver enkelt kunde. Da kan den støyen hver kunde vil måle, skilles ut.

Mikrofonen som tar inn lyden, er koblet til kunstig intelligens. (Foto: Norsonic)

Mikrofonen som tar inn lyden, er koblet til kunstig intelligens. Foto: Norsonic

– Vi mennesker lærer dette ganske kjapt. Jeg vet hva jeg hører. Maskinen kan også lære det, men det er ikke like lett, sier hun.

Det skyldes slike ting som at omgivelsene og avstanden påvirker lyden. Lyden fra kilden endrer seg før den kommer dit du er. I tillegg kan lyden variere selv om øret ditt hører at dette er en tilsvarende kilde.

For eksempel: Den ene gravemaskinen kan ha et annet turtall på motoren sin enn den andre. For deg og meg er det enkelt å høre at begge lydene er en gravemaskin, men for en maskin som lytter, er det to forskjellige lyder, og den må lære at begge er en gravemaskin.

NoiseTag er nettopp lansert. – Det som er typisk for kunstig intelligens, er at når vi tar den i bruk og det kommer mer data, blir den flinkere. Vi håper at den kommer til å bli bedre etter hvert som flere bruker den, sier Gelderblom.

Neste: RoAR

Nå bygger SINTEF videre på NoiseTag med et nytt forskningsprosjekt i samarbeid med Norsonic og NINA. Robust Acoustic Recognition – RoAR – skal minimalisere det manuelle arbeidet som er nødvendig for å sette opp et nytt system for å klassifisere nye typer lydkilder.KI 

RoAR varer til 2028. Norges forskningsråd og Norsonic finansierer prosjektet.

Kontaktperson