Tech reviews and news

Alexa má teraz „režim šepotu“ a je to oveľa zložitejšie, ako by ste si mysleli

click fraud protection

Počas minulotýždňového kolosálneho poklesu nových produktov a funkcií spoločnosť Amazon oznámila nový režim šepotu pre svoju osobnú asistentku Alexa. Táto funkcia je sústredená na myšlienku, že existujú denné doby, kedy ste prirodzene pokojní, ako napr skoro ráno, keď váš partner môže ešte spať, alebo večer, keď sú deti spí.

Keď však ostatní chytia z, možno budete chcieť požiadať Alexu o informácie o vašom dochádzaní alebo si nastaviť budík na ráno, bez toho, aby ste zobúdzali ostatných členov domácnosti. Takže teraz, keď pošepkáte svoje velenie Alexe, zašepká späť v naturáliách.

O týždeň neskôr je Amazon vysvetlenie, ako funkcia funguje, a je to oveľa zložitejšie, ako to znie. Vedec Amazonu Zeynab Raeesy tvrdí, že šepkaná reč je zvyčajne nízkoenergetická a neznelá, čo znamená, že jej chýbajú vibrácie hlasových akordov. Vďaka tomu je pre načúvacie zariadenie, ako je Amazon Echo, oveľa ťažšie efektívne snímať zvuky.

Súvisiace: Ktorú službu Amazon Echo by ste si mali kúpiť

Raeesy tvrdí, že Amazon porovnával výkonnosť dvoch rôznych neurónových sietí s cieľom rozlíšiť medzi slovami, ktoré sa bežne rozprávajú, a slovami, ktoré sa šepkajú. Zistili, že sieť s dlhodobou pamäťou (LSTM) má lepšiu výkonnosť ako sieť s viacvrstvovými perceptrónmi (MLP)

Napísala: „Modely sú trénované v dvoch kategóriách funkcií. Jedným z nich je denná energia filtračnej banky, čo je dosť priame zastúpenie rečového signálu, ktorý zaznamenáva signálne energie v rôznych frekvenčných rozsahoch. Druhou je sada funkcií špeciálne navrhnutých na využitie rozdielov signálu medzi našepkávanou a normálnou rečou.

„Zistili sme, že sieť LSTM, ktorá nepoužíva ručne vyrobené funkcie, funguje rovnako dobre ako MLP, ktorá umožňuje, čo naznačuje, že LSTM sú schopné zistiť, ktoré atribúty signálu sú pre šepot najužitočnejšie detekcia. “

Raeesy dodal, že k tomuto prístupu existujú výhrady, a to, že čím viac dát bola sieť LSTM vystavená, tým menšie vylepšenia ponúkané ručne vyrobené funkcie priniesli. Takže model, ktorý teraz sedí v Alexe, vôbec neobsahuje ručne vyrobené funkcie.

Medzi ďalšie problémy, ktoré tím musel prekonať, patril proces „koncového smerovania“. Alexa je zvyčajne schopná zistiť koniec príkazu z dôvodu obdobia ticha na konci. To sa stáva pri šepkaní problematickejšie a schopnosť siete LSTM bola ku koncu výpovedí menej efektívna.

Povedala: „Neočakávane priniesla najlepšie výsledky spriemerovanie celého signálu - vrátane problémových posledných 50 snímok. Máme však podozrenie, že je to preto, lebo vzorky šepkanej reči, ktoré sme použili pri našich experimentoch, boli ručne segmentované, zatiaľ čo vzorky normálnej reči boli automaticky segmentované pomocou produkcie spoločnosti Alexa koncový ukazovateľ.

„Medzi manuálnou a automatickou segmentáciou môže byť nejaký konzistentný rozdiel, o aký systém vlastne išlo Využitie na rozlíšenie týchto dvoch typov vstupu a vypustenie posledných 50 snímok tento rozdiel sťažilo zistiť. “

Myslíte si, že režim šepotu je užitočným doplnkom sady Alexiných schopností? Napíšte nám linku @TrustedReviews na Twitteri.

Recenzia Sapphire Radeon HD 3870 512 MB GDDR4

Recenzia Sapphire Radeon HD 3870 512 MB GDDR4

Kľúčové špecifikácieCena recenzie: 139,98 GBPZa posledných pár mesiacov to nVidia mala celkom ľah...

Čítaj Viac

Recenzia Fujifilm Finepix F100fd

Recenzia Fujifilm Finepix F100fd

Kľúčové špecifikácieCena kontroly: 200,00 GBPPonuka spotrebných digitálnych kompaktov spoločnosti...

Čítaj Viac

Recenzia QNAP TS-219 Turbo NAS

Recenzia QNAP TS-219 Turbo NAS

Kľúčové špecifikácieCena kontroly: 294,39 GBPPosledné zariadenie NAS od spoločnosti QNAP s dvojit...

Čítaj Viac

insta story