04 février 2023

Une intelligence artificielle capable de reproduire fidèlement la voix d'une personne


Vous connaissiez les deepfakes, ces vidéos où le visage d'une personne célèbre était recopié pour lui faire dire tout et n'importe quoi par un imitateur ? Eh bien, la startup ElevenLabs vient de dévoiler la première version d'un programme qui viendra compléter l'attirail : une intelligence artificielle capable de reproduire fidèlement la voix d'une personne.
La startup ElevenLabs permet de cloner une voix célèbre et lui faire dire un texte prédéterminé. Un outil qui a déjà entrainé de nombreux abus.
Basé sur le modèle de Dall-E ou ChatGPT, l'outil est très simple : il suffit d'inscrire un texte qui sera ensuite récité par le modèle pré-enregistré, des voix synthétiques mais réalistes (uniquement en anglais pour le moment). L'idée est par exemple de produire des livres audio facilement.


Mais le véritable coup de force de cette startup, fondée par d'anciens employés de Google et de Palantir, est de s'inspirer de simples extraits audio, au format MP3, que l'utilisateur peut soumettre à l'algorithme. Au total, il est possible de le faire travailler sur cinquante extraits pour une même voix.

Voici, par exemple, ce que la rédaction de Tech&Co a pu créer en utilisant la voix de Donald Trump, soudainement devenu fan d'Eddy Mitchell.


Et voici Barack Obama qui se plaint du métro parisien.

Cet outil, qui repose tout de même sur une base légale fragile, a évidement rapidement été repris sur les forums où les utilisateurs ont multiplié les blagues plus ou moins tendancieuses. "Alors que nous voyons notre technologie être massivement utilisée de façon positive, nous constatons aussi un nombre croissant de cas d'utilisation abusive du clonage de la voix" a d'ailleurs signalé ElevenLabs sur Twitter.

Selon le site américain Vice, des clips reprenant les voix de célébrités - dont l'actrice britannique Emma Watson proférant des insultes racistes - ont notamment été diffusés. De son côté, ElevenLabs a décidé de mettre à jour ses règles d'usage : d'abord en rendant payante l'option pour copier des voix existantes (cela permettra d'avoir l'identité bancaire de la personne) mais aussi en mettant en place un outil qui permettra d'identifier les voix issues du programme. 

Aucun commentaire:

Enregistrer un commentaire

Remarque : Seul un membre de ce blog est autorisé à enregistrer un commentaire.