Tech reviews and news

Écoutez la nouvelle IA vocale de Microsoft qui imite votre voix à partir de 3 secondes d'audio

click fraud protection

Microsoft a révélé un outil qui peut simuler la voix et la parole d'une personne lorsqu'on lui donne seulement trois secondes d'échantillon audio pour le baser.

L'outil VALL-E est un modèle de langage de codec naturel, selon les recherches, et peut être utilisé pour synthétiser la parole. L'idée est d'améliorer les capacités de synthèse vocale et de la rendre un peu plus naturelle.

Accord sur le haut débit avec Virgin Media

Accord sur le haut débit avec Virgin Media

Dans le cadre de ses soldes d'hiver, vous pouvez obtenir une moyenne de vitesse de téléchargement de 516 Mbps pour 33 £ par mois auprès de Virgin Media. Le contrat dure 18 mois et il y a des frais d'installation de 9,99 £, mais pour des vitesses aussi élevées, c'est un achat idéal pour les grands ménages.

  • Médias vierges
  • Vitesses moyennes de 516 Mbps
  • 33 £/mois
Voir l'offre

Dans un publier sur GitHub, Microsoft affirme que même avec un échantillon de parole très limité, l'outil est capable de maintenir l'authenticité et l'émotion dans la voix.

Que l'orateur soit en colère, amusé, dégoûté ou endormi, VALL-E peut maintenir l'émotion lorsqu'il simule la voix. Ce n'est pas encore parfait, loin de là, et semble avoir des problèmes avec certains des accents les plus forts, mais dans l'ensemble, c'est assez impressionnant pour une preuve de concept.

L'entreprise a formé l'outil à l'aide de la technologie créée par Meta. L'outil LibriLight dispose de 60 000 heures de discours en anglais de 7 000 locuteurs. Meta a créé la technologie pour tenter de combler les lacunes des appels audio lorsque le signal est faible, mais Microsoft a d'autres objectifs en tête.

Présentation de VALL-E
Crédit image: Microsoft

Comme pour tout ce qui concerne l'IA, il y aura des craintes que la technologie ne soit utilisée à mauvais escient pour donner l'impression que quelqu'un a dit quelque chose qu'il n'a pas dit. C'est quelque chose que nous avons déjà expérimenté avec les deepfakes vidéo.

Cependant, si la technologie est utilisée pour les bonnes raisons, elle pourrait aider les personnes qui ont perdu la voix à communiquer à nouveau avec les autres dans leur propre discours.

Vous ne pouvez pas encore l'essayer par vous-même, mais Microsoft a a sorti beaucoup d'échantillons (via Ars Technica) présentant la technologie.

Dans un article expliquant les essais, Microsoft déclare: "VALL-E émerge des capacités d'apprentissage en contexte et peut être utilisé pour synthétiser un discours personnalisé de haute qualité avec seulement un enregistrement inscrit de 3 secondes d'un locuteur invisible en tant qu'acoustique rapide. Les résultats des expériences montrent que VALL-E surpasse de manière significative le système TTS zéro-shot de pointe en termes de naturel de la parole et de similarité des locuteurs. De plus, nous constatons que VALL-E pourrait préserver l'émotion de l'orateur et l'environnement acoustique de l'invite acoustique en synthèse.

Tu pourrais aimer…

À quoi s'attendre de Google en 2023

À quoi s'attendre de Google en 2023

Thomas DehanIl y a 2 semaines
À quoi s'attendre de Microsoft en 2023

À quoi s'attendre de Microsoft en 2023

Ryan JonesIl y a 2 semaines
À quoi s'attendre d'Apple en 2023: RA, Mac Pro et iPhone 15

À quoi s'attendre d'Apple en 2023: RA, Mac Pro et iPhone 15

Max ParkerIl y a 2 semaines

Pourquoi faire confiance à notre journalisme ?

Fondée en 2004, Trusted Reviews existe pour donner à nos lecteurs des conseils approfondis, impartiaux et indépendants sur ce qu'il faut acheter.

Aujourd'hui, nous comptons des millions d'utilisateurs par mois dans le monde entier et évaluons plus de 1 000 produits par an.

Ted Lasso, Roy f ***** n 'Kent et l'AFC Richmond arrivent sur FIFA 23

Ted Lasso, Roy f ***** n 'Kent et l'AFC Richmond arrivent sur FIFA 23

Selon la rumeur plus tôt cette semaine, l'entraîneur de foot fictif Ted Lasso et son équipe de l'...

Lire La Suite

Ordinateur de poche Logitech G Cloud avec Xbox Game Pass et GeForce Now entièrement dévoilé

Ordinateur de poche Logitech G Cloud avec Xbox Game Pass et GeForce Now entièrement dévoilé

Après avoir prévisualisé l'appareil le mois dernier, Logitech a pleinement révélé le Ordinateur d...

Lire La Suite

Google traçant la guerre des formats avec Dolby Atmos et Vision – rapport

Google traçant la guerre des formats avec Dolby Atmos et Vision – rapport

Google chercherait à bouleverser le paysage audio immersif HDR et 3D avec de nouveaux formats lib...

Lire La Suite

insta story