Tech reviews and news

У Alexa теперь есть «режим шепота», и он намного сложнее, чем вы думаете

click fraud protection

Во время колоссального количества новых продуктов и функций на прошлой неделе Amazon анонсировала новый режим шепота для своего личного помощника Alexa. В основе этой функции лежит идея, что бывают моменты дня, когда вы от природы спокойны, например рано утром, когда ваш партнер еще спит, или вечером, когда дети спящий.

Однако, когда другие улавливают какие-то z, вы все равно можете попросить Алексу рассказать о ваших поездках на работу или установить будильник на утро, не будя других членов семьи. Итак, теперь, если вы шепнете свою команду Алексе, она ответит тем же.

Через неделю Amazon объясняя, как работает эта функция, и это намного сложнее, чем кажется. Ученый Amazon Зейнаб Рэйси говорит, что шепот, как правило, низкоэнергетический и глухой, что означает отсутствие вибрации голосовых связок. Это значительно затрудняет эффективное улавливание звуков для такого прослушивающего устройства, как Amazon Echo.

Связанный: Какой Amazon Echo стоит купить

Рэйси говорит, что Amazon сравнил производительность двух разных нейронных сетей, чтобы различать слова, которые произносятся нормально, и те, которые произносятся шепотом. Они обнаружили, что сеть долгосрочной краткосрочной памяти (LSTM) работает лучше, чем сеть многослойных персептронов (MLP).

Она написала: «Модели обучаются по двум категориям функций. Один из них - это логарифмический блок фильтров, довольно прямое представление речевого сигнала, который записывает энергии сигнала в различных частотных диапазонах. Другой - набор функций, специально разработанных для использования различий сигналов между шепотом и нормальной речью.

«Мы обнаружили, что сеть LSTM, в которой не используются созданные вручную функции, работает так же хорошо, как и сеть MLP, указывает на то, что LSTM способны изучать, какие атрибуты сигнала наиболее полезны для шепота. обнаружение. "

Рэйси добавила, что у этого подхода есть предостережения, а именно: чем больше данных будет доступно для сети LSTM, тем меньше улучшений будут предлагать созданные вручную функции. Итак, модель, которая сейчас находится в Alexa, вообще не включает в себя ручные функции.

Другие проблемы, которые пришлось преодолеть команде, включали процесс «определения конца». Обычно Alexa может определить конец команды из-за периода молчания в конце. Это становится более проблематичным с шепотом, и способность сети LSTM была менее эффективной к концу произнесения.

Она сказала: «Неожиданно усреднение всего сигнала, включая неприятные последние 50 кадров, дало наилучшие результаты. Однако мы подозреваем, что это потому, что образцы шепотной речи, которые мы использовали в наших экспериментах, были сегментированы вручную, в то время как образцы нормальной речи были сегментированы автоматически с использованием продукции Alexa. конечный указатель.

«Между ручной и автоматической сегментацией может быть какое-то постоянное различие в том, что система на самом деле использование, чтобы различать два типа ввода, и отбрасывание последних 50 кадров сделало это различие более трудным обнаружить.

Считаете ли вы, что режим шепота является полезным дополнением к набору навыков Алексы? Напишите нам @TrustedReviews в Twitter.

Принесите Голливуд домой с телевизорами Panasonic GX820 (спонсируется)

Принесите Голливуд домой с телевизорами Panasonic GX820 (спонсируется)

В партнерстве с Currys PC World.С момента своего создания целью телевидения всегда было привнести...

Прочитайте больше

Приставка Amazon появится перед Рождеством, говорится в отчете

По слухам, Amazon приставка для HD-телевизоров будет доступно для покупки до Рождества, согласно ...

Прочитайте больше

Сообщается о проблемах с датчиком движения iPhone 5S

Отчеты предполагают, что айфон 5с могут возникнуть серьезные проблемы с продвинутыми датчиками дв...

Прочитайте больше

insta story