Konstgjord Intelligens Har Lärt Sig Att Känna Igen Tal Bland Brus - Alternativ Vy

Konstgjord Intelligens Har Lärt Sig Att Känna Igen Tal Bland Brus - Alternativ Vy
Konstgjord Intelligens Har Lärt Sig Att Känna Igen Tal Bland Brus - Alternativ Vy

Video: Konstgjord Intelligens Har Lärt Sig Att Känna Igen Tal Bland Brus - Alternativ Vy

Video: Konstgjord Intelligens Har Lärt Sig Att Känna Igen Tal Bland Brus - Alternativ Vy
Video: Att återhämta sig från anorexia – Sofie & Chris – Highlighted by Lyko 2024, Maj
Anonim

Virtuella assistenter och röstigenkänningssystem har lärt sig att "känna igen" vad en person säger till dem och att följa hans kommandon. Men för korrekt drift av samma Siri och Cortana kan främmande buller vara ett stort problem. Experter från Mitsubishi Electric kan hjälpa till att hantera denna tekniska brist, som presenterade en ny teknik för att skilja en persons tal från det allmänna bruset.

Det japanska företagets teknik kallas Deep Clustering, vars funktion bygger på principerna för maskininlärning. Till en början lärde sig konstgjord intelligens att oberoende separera en persons tal från den allmänna strömmen av olika ljud och ljud. Neuralnätet separerar inkommande ljuddata i olika element och analyserar var och en separat, varefter den redan kan behandla den mänskliga rösten. Liknande arbete observeras när två eller flera samtalare är "anslutna".

Under en demonstration av tekniken från ett japanskt företag kunde systemet framgångsrikt separera talet från två personer som talade samma mening på olika språk till en mikrofon. All behandling utfördes i realtid och förseningen överskred inte tre sekunder. Noggrannheten var 90 procent, och när tre personer började prata i mikrofonen sjönk andelen "träffar" till 80, vilket också är ett bra resultat. Enligt författarna till projektet Anthony Vetro och Yohei Okato, "Till skillnad från att separera tal från bakgrundsljud är det mycket svårt att separera talet från en person från" röst "-bruset hos människor som talar samtidigt, eftersom ljudet från olika människors röst har många känslor. I de flesta system löses problemet med röstseparation genom att installera två eller flera mikrofoner, men i fallet med bara en mikrofon kan bara konstgjord intelligens hantera röstseparationsuppgiften. Denna teknik kan användas varhelst hög noggrannhet för röstmeddelandeigenkänning krävs. Till exempel i röststyrningssystem för bilar, hissar, hushållsapparater och andra elektroniska enheter."

VLADIMIR KUZNETSOV

Rekommenderas: