Google a une IA qui peut transformer des invites de texte en musique

Google a une IA qui peut transformer des invites de texte en musique

Si la controverse entourant l’art généré par l’IA ne suffit pas, Google a créé MusicLM, un système qui génère de la musique à partir de descriptions textuelles, d’images et de mélodies simples. Si vous pensez que cela semble trop beau pour être vrai, continuez à lire pour en savoir plus.

Google a une IA appelée MusicLM

Alors que Google n’a pas encore officiellement publié MusicLM , le système d’IA générative fait déjà la une des journaux. Dans son résumé de recherche, où il échantillonne ce que la technologie peut faire, Google la décrit comme un modèle qui génère « de la musique haute fidélité à partir de descriptions textuelles ».

Le logiciel, qui a été formé à l’aide de plus de 280 000 heures de musique, propose divers scénarios musicaux dans un certain nombre de formats. Cela inclut la génération audio à partir de légendes riches , le mode histoire et le conditionnement des légendes de peinture – une peinture associée à une description de celle-ci (Google a inclus un échantillon de l’audio généré par l’IA).

Deux peintures avec des descriptions textuelles sur le côté et un son généré par l'IA

Google n’est pas le premier à utiliser l’IA pour la production musicale. Par exemple, LALAL.AI dispose d’un algorithme Cassiopeia utilisant un réseau de neurones artificiels qui sépare les voix et l’instrument sans avoir besoin d’une exécution manuelle de la part d’un ingénieur. Cependant, Google a fait un énorme pas en avant dans la création d’un système capable de générer de la musique à partir de texte uniquement.

Google ne publiera pas MusicLM : voici pourquoi

Malheureusement pour Google, il est peu probable que MusicLM sorte. La raison la plus évidente est qu’elle enfreint la musique protégée par le droit d’auteur. Lorsque Google a effectué des tests dessus, ils ont découvert qu’au moins 1 % de chaque chanson que le système recrachait était identique à la musique qu’il utilisait pour entraîner le logiciel.

Cette statistique peut sembler faible, mais elle est catastrophique et Google n’est pas prêt à s’impliquer dans des poursuites judiciaires.

De plus, la technologie peut être sans précédent dans son domaine, mais il y a encore des éléments qui doivent être affinés ; les voix sonnent boguées et déformées, et la langue ressemble plus à Simlish qu’à n’importe quelle langue existante dans le monde réel.

Google devrait repenser MusicLM

MusicLM pourrait être d’une grande aide pour les musiciens et les non-musiciens, mais à moins que Google n’apporte des améliorations importantes, il ne devrait pas être mis en ligne. Si le système doit être publié, au moins deux changements majeurs doivent se produire.

Tout d’abord, Google doit trouver un moyen de rendre MusicLM plus éthique. Shutterstock a rendu la génération d’art de l’IA plus éthique et accessible aux utilisateurs, peut-être que Google pourrait emboîter le pas. Si Google devait former MusicLM avec de la musique prête à être licenciée, ainsi que rémunérer les artistes qui contribuent au système, alors le publier pourrait être faisable.

Deuxièmement, Google doit améliorer la voix. Si Google ne peut pas trouver un moyen de contourner les voix et le charabia irréalistes, il devrait les renoncer complètement. Un logiciel comme Vocaloid serait la norme, et s’il ne répond pas à la même qualité, la fonction est futile.

Pas aujourd’hui, Google

Il est évident qu’il existe de nombreuses complications avec MusicLM, et publier le logiciel tel quel serait une mauvaise décision. Mais la technologie progresse en un clin d’œil, il y a donc toujours la possibilité que quelque chose de mieux se présente, mais pas aujourd’hui.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *