Kunstig Intelligens Har Lært At Korrekt Genkende Tale Blandt Støj - Alternativ Visning

Kunstig Intelligens Har Lært At Korrekt Genkende Tale Blandt Støj - Alternativ Visning
Kunstig Intelligens Har Lært At Korrekt Genkende Tale Blandt Støj - Alternativ Visning
Anonim

Virtuelle assistenter og stemmegenkendelsessystemer har lært at "genkende" hvad en person siger til dem og følge hans kommandoer. Men for den korrekte betjening af den samme Siri og Cortana, kan ekstern støj være et stort problem. Eksperter fra Mitsubishi Electric kan hjælpe med at tackle denne tekniske fejl, der præsenterede en ny teknologi til at adskille en persons tale fra den generelle støj.

Teknologien fra det japanske firma kaldes Deep Clustering, hvis funktion bygger på principperne for maskinlæring. Til at begynde med lærte kunstig intelligens at uafhængigt adskille en persons tale fra den generelle strøm af forskellige lyde og lyde. Det neurale netværk adskiller de indkommende lyddata i forskellige elementer og analyserer hver for sig, hvorefter det allerede kan behandle den menneskelige stemme. Tilsvarende arbejde observeres, når to eller flere samtalepartnere er "forbundet".

Under en demonstration af teknologien fra et japansk firma kunne systemet med succes adskille talen fra to mennesker, der taler den samme sætning på forskellige sprog til en mikrofon. Al behandling blev udført i realtid, og forsinkelsen oversteg ikke tre sekunder. Genkendelsesnøjagtigheden var 90 procent, og da tre personer begyndte at tale ind i mikrofonen, faldt procentdelen af "hits" til 80, hvilket også er et godt resultat. Ifølge forfatterne af projektet Anthony Vetro og Yohei Okato,

”I modsætning til at adskille tale fra baggrundsstøj, er det en meget vanskelig opgave at adskille en persons tale fra“stemmestøj”fra folk, der taler på samme tid, da lydene af forskellige menneskers stemmer har en masse særegenheder. I de fleste systemer løses problemet med stemmeseparation ved at installere to eller flere mikrofoner, men i tilfælde af kun en mikrofon kan kun kunstig intelligens klare opgaven med stemmeseparation. Denne teknologi kan bruges, uanset hvor høj nøjagtighed af stemmemeddelelsesgenkendelse er påkrævet. For eksempel i stemmestyringssystemer til biler, elevatorer, husholdningsbrug og andre elektroniske enheder."

VLADIMIR KUZNETSOV