Tech reviews and news

Η Alexa έχει τώρα μια «λειτουργία ψιθυρίσματος» και είναι πολύ πιο περίπλοκη από ό, τι νομίζετε

click fraud protection

Κατά την κολοσσιαία πτώση νέων προϊόντων και χαρακτηριστικών της περασμένης εβδομάδας, η Amazon ανακοίνωσε μια νέα λειτουργία ψιθυρίσματος για τον προσωπικό βοηθό της Alexa Η λειτουργία επικεντρώνεται στην ιδέα ότι υπάρχουν στιγμές της ημέρας όταν είστε φυσικά ήσυχοι, όπως νωρίς το πρωί, όταν ο σύντροφός σας μπορεί ακόμα να κοιμάται, ή το βράδυ όταν τα παιδιά είναι κοιμισμένος.

Ωστόσο, όταν άλλοι πιάνουν μερικά z, ίσως να θέλετε να ζητήσετε από την Alexa μια ενημέρωση σχετικά με τις μετακινήσεις σας ή να ορίσετε ένα ξυπνητήρι για το πρωί, χωρίς να ξυπνήσετε τα μέλη του νοικοκυριού. Τώρα, αν ψιθυρίσετε την εντολή σας στην Alexa, θα ψιθυρίσει πίσω στο είδος.

Μια εβδομάδα μετά, το Amazon είναι εξηγώντας πώς λειτουργεί το χαρακτηριστικό, και είναι πολύ πιο περίπλοκο από ό, τι ακούγεται. Ο επιστήμονας του Amazon Zeynab Raeesy λέει ότι ο ψιθυρισμένος λόγος είναι συνήθως χαμηλής ενέργειας και χωρίς φωνή, πράγμα που σημαίνει ότι δεν έχει τη δόνηση στις φωνητικές χορδές. Αυτό καθιστά πολύ πιο δύσκολο για μια συσκευή ακρόασης όπως το Amazon Echo να λαμβάνει αποτελεσματικά τους ήχους.

Σχετιζομαι με: Ποιο Amazon Echo πρέπει να αγοράσετε

Ο Raeesy λέει ότι η Amazon συνέκρινε την απόδοση δύο διαφορετικών νευρωνικών δικτύων για να διακρίνει μεταξύ λέξεων που λέγονται κανονικά και εκείνων που ψιθύρισαν. Βρήκαν ένα δίκτυο μακροπρόθεσμης μνήμης (LSTM) που έχει καλύτερη απόδοση από το δίκτυο πολλαπλών επιπέδων perceptron (MLP)

Έγραψε: «Τα μοντέλα εκπαιδεύονται σε δύο κατηγορίες χαρακτηριστικών. Το ένα είναι η ενέργεια των τραπεζών φίλτρου καταγραφής, μια αρκετά άμεση αναπαράσταση του σήματος ομιλίας που καταγράφει τις ενέργειες σήματος σε διαφορετικά εύρη συχνοτήτων. Το άλλο είναι ένα σύνολο χαρακτηριστικών που έχουν σχεδιαστεί ειδικά για την εκμετάλλευση των διαφορών σήματος μεταξύ ψιθυρισμένου και κανονικού λόγου.

"Βρήκαμε ότι ένα δίκτυο LSTM που δεν χρησιμοποιεί χειροποίητες λειτουργίες αποδίδει όπως και ένα MLP που λειτουργεί, υποδεικνύοντας ότι τα LSTM είναι ικανά να μάθουν ποια χαρακτηριστικά σήματος είναι πιο χρήσιμα για ψίθυρο ανίχνευση."

Η Raeesy πρόσθεσε ότι υπήρχαν επιφυλάξεις σε αυτήν την προσέγγιση, δηλαδή ότι όσο περισσότερα δεδομένα εκτέθηκε το δίκτυο LSTM, τόσο λιγότερη βελτίωση προσφέρθηκαν τα χειροποίητα χαρακτηριστικά. Έτσι, το μοντέλο που βρίσκεται τώρα στην Alexa δεν περιλαμβάνει καθόλου τα χειροποίητα χαρακτηριστικά.

Άλλα προβλήματα που έπρεπε να ξεπεράσει η ομάδα περιελάμβαναν τη διαδικασία «τελικής κατάδειξης». Συνήθως, η Alexa μπορεί να εντοπίσει το τέλος μιας εντολής λόγω της περιόδου σιωπής στο τέλος. Αυτό γίνεται πιο προβληματικό με ψιθυρίζοντας και η ικανότητα του δικτύου LSTM ήταν λιγότερο αποτελεσματική προς το τέλος των λόγων.

Είπε: «Απροσδόκητα, ο μέσος όρος ολόκληρου του σήματος - συμπεριλαμβανομένων των ενοχλητικών τελικών 50 καρέ - απέδωσε τα καλύτερα αποτελέσματα. Υποψιαζόμαστε, ωστόσο, αυτό συμβαίνει επειδή τα δείγματα ψιθυρισμένης ομιλίας που χρησιμοποιήσαμε στα πειράματά μας ήταν χειροκίνητη τμηματοποίηση, ενώ τα δείγματα της κανονικής ομιλίας τμηματοποιήθηκαν αυτόματα, χρησιμοποιώντας την παραγωγή της Alexa τελικός δείκτης.

«Θα μπορούσε να υπάρξει κάποια σταθερή διαφορά μεταξύ της χειροκίνητης και της αυτόματης τμηματοποίησης ότι το σύστημα ήταν στην πραγματικότητα αξιοποιώντας για να διακρίνουμε τους δύο τύπους εισόδου, και ρίχνοντας τα τελικά 50 καρέ έκανε αυτή τη διαφορά πιο δύσκολη ανιχνεύουν."

Πιστεύετε ότι η λειτουργία ψιθυρίσματος είναι μια χρήσιμη προσθήκη στο skillet της Alexa; Αφήστε μας μια γραμμή @TrustedReviews στο Twitter.

Δρομολογητής Western Digital My Net AC1300 802.11ac - Επιδόσεις, απόδοση και αξιολόγηση απόφασης

Δρομολογητής Western Digital My Net AC1300 802.11ac - Επιδόσεις, απόδοση και αξιολόγηση απόφασης

ΕνότητεςΣελίδα 1Αναθεώρηση δρομολογητή Western Digital My Net AC1300 802.11acΣελίδα 2Επιδόσεις απ...

Διαβάστε περισσότερα

GTX 1070 Ti - Nvidia GeForce GTX 1070 Ti - Επιδόσεις, overclocking και συμπέρασμα

GTX 1070 Ti - Nvidia GeForce GTX 1070 Ti - Επιδόσεις, overclocking και συμπέρασμα

ΕνότητεςΣελίδα 1Αναθεώρηση Nvidia GeForce GTX 1070 TiΣελίδα 2Nvidia GeForce GTX 1070 Ti - Επιδόσε...

Διαβάστε περισσότερα

HP ZBook 15 - Πληκτρολόγιο, Trackpad, Επιλογές διαμόρφωσης και Έλεγχος απόφασης

HP ZBook 15 - Πληκτρολόγιο, Trackpad, Επιλογές διαμόρφωσης και Έλεγχος απόφασης

ΕνότητεςΣελίδα 1Αναθεώρηση HP ZBook 15 G2Σελίδα 2Επιδόσεις απόδοσης, θερμότητας, θορύβου και διάρ...

Διαβάστε περισσότερα

insta story