Découvrez les morceaux utilisés pour entraîner les IA
The Atlantic a créé AI Watchdog, un outil révélant les morceaux de musique utilisés pour entraîner des IA. Parmi les bases de données, deux contiennent 12 millions et 9 millions de titres, et des artistes comme Lady Gaga ou Radiohead y figurent.
« Alex Reisner a mis la main sur quatre énormes bases de données musicales utilisées dans l’entraînement de modèles d’IA. » — Le Big Data
Que faut-il retenir ?
- Deux bases de données contiennent environ 12 millions et 9 millions de titres.
- Les deux autres bases dépassent les 100 000 chansons chacune.
- Des artistes comme Lady Gaga, Radiohead et Bruce Springsteen figurent dans les données.
- L'outil AI Watchdog permet aussi d'explorer les livres et œuvres utilisés pour entraîner des IA.
Pourquoi cette nouvelle compte-t-elle ?
Cet outil révèle l'ampleur des données utilisées pour entraîner les IA génératives, soulignant des questions éthiques et légales. Les professionnels peuvent mieux comprendre les sources des modèles et les implications pour les droits d'auteur.
12 millions de titres dans une base de données
💬 Alex Reisner, Journaliste
Public concerné : développeurs, entreprises
Quels artistes figurent dans les bases de données utilisées pour entraîner les IA ?
Des artistes comme Lady Gaga, Radiohead, Bruce Springsteen et Aphex Twin sont présents dans les bases de données révélées par AI Watchdog.