Kunstig Intelligens Har Lært At Korrekt Genkende Tale Blandt Støj - Alternativ Visning

2024 Forfatter: Keith Bush | [email protected]. Sidst ændret: 2023-12-16 14:08

Virtuelle assistenter og stemmegenkendelsessystemer har lært at "genkende" hvad en person siger til dem og følge hans kommandoer. Men for den korrekte betjening af den samme Siri og Cortana, kan ekstern støj være et stort problem. Eksperter fra Mitsubishi Electric kan hjælpe med at tackle denne tekniske fejl, der præsenterede en ny teknologi til at adskille en persons tale fra den generelle støj.

Teknologien fra det japanske firma kaldes Deep Clustering, hvis funktion bygger på principperne for maskinlæring. Til at begynde med lærte kunstig intelligens at uafhængigt adskille en persons tale fra den generelle strøm af forskellige lyde og lyde. Det neurale netværk adskiller de indkommende lyddata i forskellige elementer og analyserer hver for sig, hvorefter det allerede kan behandle den menneskelige stemme. Tilsvarende arbejde observeres, når to eller flere samtalepartnere er "forbundet".

Under en demonstration af teknologien fra et japansk firma kunne systemet med succes adskille talen fra to mennesker, der taler den samme sætning på forskellige sprog til en mikrofon. Al behandling blev udført i realtid, og forsinkelsen oversteg ikke tre sekunder. Genkendelsesnøjagtigheden var 90 procent, og da tre personer begyndte at tale ind i mikrofonen, faldt procentdelen af "hits" til 80, hvilket også er et godt resultat. Ifølge forfatterne af projektet Anthony Vetro og Yohei Okato,

”I modsætning til at adskille tale fra baggrundsstøj, er det en meget vanskelig opgave at adskille en persons tale fra“stemmestøj”fra folk, der taler på samme tid, da lydene af forskellige menneskers stemmer har en masse særegenheder. I de fleste systemer løses problemet med stemmeseparation ved at installere to eller flere mikrofoner, men i tilfælde af kun en mikrofon kan kun kunstig intelligens klare opgaven med stemmeseparation. Denne teknologi kan bruges, uanset hvor høj nøjagtighed af stemmemeddelelsesgenkendelse er påkrævet. For eksempel i stemmestyringssystemer til biler, elevatorer, husholdningsbrug og andre elektroniske enheder."

VLADIMIR KUZNETSOV

Kunstig Intelligens Har Lært At Korrekt Genkende Tale Blandt Støj - Alternativ Visning

Tro Er Et Mystisk Fænomen Med Den Menneskelige Psyke - Alternativ Visning

Fordel Ved Kvindelige Astronauter: Den Første Flyvning Til Mars Kan Være Rent Kvindelige - Alternativ Visning

Skizofreni Viste Sig At Være To Forskellige Sygdomme - Alternativ Visning

Psykiaterens Mening: Skizofreni Pålægges Børn Og Unge Gennem Populærkultur - Alternativ Visning

Vil En Sund Person Være I Stand Til At Flygte Fra Et Psykiatrisk Hospital? - Alternativ Visning

Stor Russisk Prinsesse Elena Glinskaya - Alternativ Visning

Berømtheder, Der Betragtes Som Udlændinge - Alternativ Visning

H. P. Blavatsky Om Jødisk Historie: Men Ingen Spor Er Fundet - Død Stille! - Alternativ Visning

Mysticisme Af Indien Og Blavatsky - Alternativ Visning

Hemmelighederne Hos Helena Blavatsky - Alternativ Visning

Løsning, Eller Om Det Er Nødvendigt At Betale Fortunetellers - Alternativ Visning

Fortune Telling På Pejs Kul - Alternativ Visning

Templernes æra - Alternativ Visning

Hekse Sabbat - Walpurgis Night: Traditioner, Ritualer, Spådom Og Tegn - Alternativ Visning

Spådomsgebyr - Alternativ Visning