Jodemontmartre a écrit:Bon, ça y est, j’écoute le CD. Bon, c’est Coltrane sans aucun doute. C’est bon. Très bon. C’est AAD.mono .
Je suis étonné de la qualité. Les bandes ne trahissent pas leur âge. Moi, j’aurais admis quelques irrégularités. Même pas. D’ailleurs ils préviennent que vu le grand âge de l’entregistrement il peut y avoir des défauts. Au deuxième passage des CD, je n’ai rien remarqué.
[Mode parano on ] A l’ère de l’IA, ne pourrait on pas demander à un supercomputer de recréer une session nouvelle en lui faisant ingérer tout Coltrane ? [Mode parano /off]
Quand j'étais encore étudiant il y a 7-8 ans (et bien avant toute cette mode liée à l'IA par des gens qui n'y connaissent pas grand chose), un type avait fait ce travail avec Bach. Il en sortait des partitions en format numérique que l'algo sortait en format MIDI. La musique qui en sortait était assez crédible, même si la technique utilisée était assez rudimentaire (méthode des forêts aléatoires assistées)
Cependant, on pourrait imaginer ce travail avec les techniques nouvelles issues de l'imagerie: Un premier algorithme dont le seul but est de créer la musique et de dissimuler le fait que cette création ne soit pas une oeuvre originale de Bach. Un second algorithme dont le seul but est de détecter si une oeuvre est de Bach ou non.
Quand une proposition du premier algorithme est détectée comme une falsification par le second algorithme, le premier algorithme reçoit l'information que sa proposition a bien été identifiée comme une supercherie. Ainsi, il va intégrer cet essai infructueux pour proposer une nouvelle partition et ainsi de suite pour plusieurs millions d'essais, jusqu'à ce que le second algorithme soit incapable de distinguer le vrai Bach du faux de manière consistante. On peut pousser la logique en permettant au second algorithme d'apprendre de son côté aussi quand il n'a pas pu détectée une supercherie proposée par le premier algorithme. Les deux algorithmes entrent alors en compétition dans une boucle infinie.
Cette technique est déjà utilisée pour falsifier des images, des vidéos et des bandes sonores. Et même de combiner le mouvement des lèvres dans une vidéo avec une piste sonore contenant des voix elle-même générée par l'IA. Voici un exemple avec une fausse vidéo d'Obama crée ainsi:
C'est un travail d'amateurs de chez Buzzfeed, sans les ressources computationnelles de professionnels et la connaissance théorique (ils ont juste réutilisé un kit trouvable partout sur le net sans en modifier le fonctionnement du code). On remarquera que le timbre de la voix est trop aigu par rapport à la vraie voix, mais les tics de langage et la diction est déjà assez bien maîtrisé. Imagine ce qu'un professionnel avec des ressources pourrait faire...
Les applications de ce concept pour reconstituer des bandes analogiques en mauvais état, pour les DSP des sytèmes actifs, etc. ont un potentiel énorme. Mais aussi, avec ces avancées technologiques, le concept du Fake News popularisé ces dernières années pourrait atteindre un sommet de sophistication jamais connu avec la possibilité de créer de fausses preuves indétectable d'un point de vue technique. Il faudra donc revenir à la base de toute chose pour déchiffrer le vrai du faux: le bon sens, la contextualisation de l'information et tout simplement l'entendement humain.
Amitiés,
Joon