Le cauchemar de l’industrie musicale s’est réalisé en 2023, et cela ressemblait beaucoup à Drake.
“Le cœur sur ma manche”, un duo convaincant entre Drake et The Weeknd, a accumulé des millions de ruisseaux avant que quiconque puisse expliquer qui l’a fait ou d’où il vient. La piste n’est pas simplement devenue virale – elle a brisé l’illusion que quiconque était en contrôle.
Dans The Scramble To Réponse, une nouvelle catégorie d’infrastructures prend tranquillement une forme qui n’est pas conçue pour arrêter la musique générative, mais pour la rendre traçable. Les systèmes de détection sont intégrés à l’ensemble du pipeline de musique: dans les outils utilisés pour former des modèles, les plates-formes où les chansons sont téléchargées, les bases de données qui licencient les droits et les algorithmes qui façonnent la découverte. L’objectif n’est pas seulement d’attraper du contenu synthétique après coup. Il s’agit de l’identifier tôt, de le marquer avec des métadonnées et de gouverner la façon dont il se déplace dans le système.
“Si vous ne construisez pas ces trucs dans l’infrastructure, vous allez juste vous poursuivre la queue”, explique Matt Adell, cofondateur de Musical IA. “Vous ne pouvez pas continuer à réagir à chaque nouveau piste ou modèle – qui ne s’allonge pas. Vous avez besoin d’infrastructures qui fonctionnent de la formation à la distribution.”
L’objectif n’est pas le démontage, mais les licences et le contrôle
Les startups apparaissent désormais pour créer une détection dans les flux de travail de licence. Des plates-formes comme YouTube et Deezer ont développé des systèmes internes pour signaler l’audio synthétique lorsqu’ils sont téléchargés et façonner la façon dont il fait surface dans la recherche et les recommandations. D’autres sociétés musicales – y compris Audible Magic, PEX, RightSify et SoundCloud – élargissent les fonctionnalités de détection, de modération et d’attribution à travers tout, des ensembles de données de formation à la distribution.
Le résultat est un écosystème fragmenté mais à croissance rapide des entreprises traitant la détection du contenu généré par l’IA non pas comme un outil d’application, mais comme des infrastructures de table pour le suivi des supports synthétiques.
Plutôt que de détecter la musique d’IA après sa diffusion, certaines entreprises construisent des outils pour le marquer à partir du moment où il est fabriqué. Vermillio et l’IA musical développent des systèmes pour scanner des pistes finies pour les éléments synthétiques et les étiqueter automatiquement dans les métadonnées.
Le cadre TraceID de Vermillio va plus profondément en divisant les chansons en tiges – comme le ton vocal, la phrasé mélodique et les modèles lyriques – et signaler les segments spécifiques générés par l’IA, permettant aux titulaires de droits de détecter le mimétisme au niveau des tiges, même si un nouveau morceau n’engage que des parties d’un original.
La société affirme que son objectif n’est pas des retraits, mais une licence proactive et une libération authentifiée. TraceID est positionné en remplacement de systèmes comme l’ID de contenu de YouTube, qui manquent souvent des imitations subtiles ou partielles. Vermillio estime que les licences authentifiées alimentées par des outils comme TraceID pourraient passer de 75 millions de dollars en 2023 à 10 milliards de dollars en 2025. Dans la pratique, cela signifie qu’un détenteur de droits ou une plate-forme peut exécuter une piste finie via TraceID pour voir s’il contient des éléments protégés – et si c’est le cas, demandez au système de le signaler pour la licence avant la libération.
«Nous essayons de quantifier l’influence créative, pas seulement des copies.»
Certaines entreprises vont encore plus en amont des données de formation elle-même. En analysant ce qui se passe dans un modèle, leur objectif est d’estimer à quel point une piste générée emprunte des artistes ou des chansons spécifiques. Ce type d’attribution pourrait permettre une licence plus précise, avec des redevances basées sur une influence créative au lieu des litiges post-libération. L’idée fait écho à de vieux débats sur l’influence musicale – comme le procès des «lignes floues» – mais les applique à la génération algorithmique. La différence est maintenant que les licences peuvent se produire avant la libération, et non par litige après coup.
L’IA musical travaille également sur un système de détection. L’entreprise décrit son système comme étant en couches sur l’ingestion, la génération et la distribution. Plutôt que de filtrer les sorties, il suit la provenance de bout en bout.
«L’attribution ne devrait pas commencer lorsque la chanson est terminée – elle doit commencer lorsque le modèle commence à apprendre», explique Sean Power, le cofondateur de l’entreprise. «Nous essayons de quantifier l’influence créative, pas seulement des copies.»
Deezer a développé des outils internes pour signaler des pistes entièrement générées par l’IA au téléchargement et réduire leur visibilité dans les recommandations algorithmiques et éditoriales, en particulier lorsque le contenu apparaît spam. Le directeur de l’innovation, Aurélien Hérault, dit qu’en avril, ces outils détectent environ 20% des nouveaux téléchargements chaque jour comme entièrement générés par l’AI – plus que le double de ce qu’ils ont vu en janvier. Les pistes identifiées par le système restent accessibles sur la plate-forme mais ne sont pas promues. Hérault dit que Deezer prévoit de commencer à étiqueter ces pistes pour les utilisateurs directement «dans quelques semaines ou quelques mois».
«Nous ne sommes pas du tout contre l’IA», explique Hérault. “Mais une grande partie de ce contenu est utilisée en mauvaise foi – non pas pour la création, mais pour exploiter la plate-forme. C’est pourquoi nous accordons autant d’attention.”
Le DNTP de Sprayning AI (ne pas former le protocole) pousse la détection encore plus tôt – au niveau de l’ensemble de données. Le protocole de désactivation permet aux artistes et aux titulaires de droits de qualifier leur travail de non-limite pour la formation modèle. Alors que les artistes visuels ont déjà accès à des outils similaires, le monde audio joue toujours au rattrapage. Jusqu’à présent, il y a peu de consensus sur la façon de standardiser le consentement, la transparence ou les licences à grande échelle. La réglementation pourrait éventuellement forcer la question, mais pour l’instant, l’approche reste fragmentée. Le soutien des grandes sociétés de formation d’IA a également été incohérent, et les critiques disent que le protocole ne gagnera pas de terrain à moins qu’il soit régi de manière indépendante et largement adoptée.
“Le protocole de désactivation doit être à but non lucratif, supervisé par quelques acteurs différents, à faire confiance”, explique Dryhurst. «Personne ne devrait faire confiance à l’avenir du consentement à une entreprise centralisée opaque qui pourrait faire faillite – ou bien pire.»
