Tech reviews and news

Alexa sekarang memiliki 'mode berbisik' dan itu jauh lebih kompleks dari yang Anda kira

click fraud protection

Selama penurunan kolosal produk dan fitur baru minggu lalu, Amazon mengumumkan mode whisper baru untuk asisten pribadi Alexa-nya. Fitur ini berpusat pada ide dan ada saat-saat ketika Anda secara alami tenang, seperti pagi-pagi sekali saat pasangan Anda mungkin masih tidur, atau pada malam hari saat anak-anak sedang tidur tertidur.

Namun, ketika orang lain menangkap beberapa z Anda mungkin masih ingin meminta Alexa untuk update tentang perjalanan Anda, atau untuk menyetel alarm untuk pagi hari, tanpa membangunkan sesama anggota rumah tangga. Jadi sekarang, jika Anda membisikkan perintah Anda pada Alexa, dia akan berbisik kembali.

Seminggu berlalu, Amazon menjelaskan cara kerja fitur tersebut, dan itu jauh lebih kompleks daripada kedengarannya. Ilmuwan Amazon Zeynab Raeesy mengatakan ucapan berbisik biasanya berenergi rendah dan tidak bersuara, artinya tidak ada getaran di pita suara. Itu membuatnya jauh lebih sulit bagi perangkat pendengar seperti Amazon Echo untuk mengambil suara secara efektif.

Terkait: Amazon Echo mana yang harus Anda beli

Raeesy mengatakan Amazon membandingkan kinerja dua jaringan saraf yang berbeda untuk membedakan antara kata-kata yang diucapkan secara normal dan yang dibisikkan. Mereka menemukan jaringan memori jangka pendek (LSTM) berkinerja lebih baik daripada jaringan multilayer perceptron (MLP).

Dia menulis: “Para model dilatih pada dua kategori fitur. Salah satunya adalah energi bank filter log, representasi yang cukup langsung dari sinyal ucapan yang merekam energi sinyal dalam rentang frekuensi yang berbeda. Yang lainnya adalah serangkaian fitur yang secara khusus direkayasa untuk memanfaatkan perbedaan sinyal antara ucapan berbisik dan normal.

“Kami menemukan bahwa jaringan LSTM yang tidak menggunakan fitur buatan bekerja sebaik MLP yang melakukannya, menunjukkan bahwa LSTM mampu mempelajari atribut sinyal mana yang paling berguna untuk whisper deteksi."

Raeesy menambahkan ada peringatan untuk pendekatan ini, yaitu semakin banyak data yang terpapar jaringan LSTM, semakin sedikit peningkatan fitur buatan tangan yang ditawarkan. Jadi, model yang sekarang ada dalam Alexa tidak menyertakan fitur buatan tangan sama sekali.

Masalah lain yang harus diatasi tim termasuk proses "titik akhir". Biasanya, Alexa dapat mendeteksi akhir suatu perintah karena periode diam di akhir. Ini menjadi lebih bermasalah dengan berbisik dan kemampuan jaringan LSTM kurang efektif menjelang akhir ucapan.

Dia berkata: “Tanpa diduga, rata-rata seluruh sinyal - termasuk 50 frame terakhir yang merepotkan - memberikan hasil terbaik. Kami menduga, bagaimanapun, itu karena sampel bisikan yang kami gunakan dalam eksperimen kami adalah tersegmentasi secara manual, sedangkan contoh ucapan normal secara otomatis tersegmentasi, menggunakan produksi Alexa penunjuk akhir.

“Mungkin ada beberapa perbedaan yang konsisten antara segmentasi manual dan otomatis bahwa sistem itu sebenarnya mengeksploitasi untuk membedakan dua jenis masukan, dan menghapus 50 bingkai terakhir membuat perbedaan itu lebih sulit mendeteksi. "

Apakah menurut Anda mode bisikan adalah tambahan yang berguna untuk keahlian Alexa? Kirimi kami baris @TrustedReviews di Twitter.

Bug shutdown OnePlus 7 Pro untuk segera diperbaiki

Beberapa perangkat OnePlus 7 Pro mengalami pematian acak. Untungnya, OnePlus mengatakan bahwa mas...

Baca Lebih Banyak

Awas, Tesla: Mercedes sedang mengerjakan 'sub-merek' mobil listrik baru

Awas, Tesla: Mercedes sedang mengerjakan 'sub-merek' mobil listrik baru

Mercedes akan menciptakan sub-merek yang sama sekali baru untuk mobil listrik, dalam upaya untuk ...

Baca Lebih Banyak

TicWatch Pro mendapatkan versi 4G LTE karena jam tangan Wear OS teratas menjadi lebih baik

Salah satu jam tangan Wear OS terbaik yang tersedia kini semakin baik. Mobvoi TicWatch Pro jam ta...

Baca Lebih Banyak

insta story