Veille IA Veille IA sans buzz : pour stratèges québécois.
La veille

Découvrez les morceaux utilisés pour entraîner les IA

Découvrez les morceaux utilisés pour entraîner les IA

4 min de lecture · Le Big Data · Ny Ando A. · 25/06/2026 IA générative 8/10 Moyen
Découvrez les morceaux utilisés pour entraîner les IA

The Atlantic a créé AI Watchdog, un outil révélant les morceaux de musique utilisés pour entraîner des IA. Parmi les bases de données, deux contiennent 12 millions et 9 millions de titres, et des artistes comme Lady Gaga ou Radiohead y figurent.

« Alex Reisner a mis la main sur quatre énormes bases de données musicales utilisées dans l’entraînement de modèles d’IA. » — Le Big Data

Que faut-il retenir ?

  • Deux bases de données contiennent environ 12 millions et 9 millions de titres.
  • Les deux autres bases dépassent les 100 000 chansons chacune.
  • Des artistes comme Lady Gaga, Radiohead et Bruce Springsteen figurent dans les données.
  • L'outil AI Watchdog permet aussi d'explorer les livres et œuvres utilisés pour entraîner des IA.

Pourquoi cette nouvelle compte-t-elle ?

Cet outil révèle l'ampleur des données utilisées pour entraîner les IA génératives, soulignant des questions éthiques et légales. Les professionnels peuvent mieux comprendre les sources des modèles et les implications pour les droits d'auteur.

12 millions de titres dans une base de données

💬 Alex Reisner, Journaliste

Public concerné : développeurs, entreprises

Quels artistes figurent dans les bases de données utilisées pour entraîner les IA ?

Des artistes comme Lady Gaga, Radiohead, Bruce Springsteen et Aphex Twin sont présents dans les bases de données révélées par AI Watchdog.

🔐 Connexion rapide

Entrez votre courriel pour recevoir un code à 6 chiffres.

Pas besoin de mot de passe ni d'inscription. Entrez votre courriel, recevez un code par courriel, et c'est tout !