Données synthétiques
Synthetic Data
📖 Définition
💬 En termes simples
C'est comme les simulateurs de vol utilisés pour former les pilotes : au lieu de risquer un vrai avion et de vrais passagers, on crée un environnement artificiel qui reproduit fidèlement les conditions réelles. Les pilotes acquièrent une expérience précieuse sans jamais quitter le sol.
🎯 Exemple concret
Des hôpitaux québécois génèrent des dossiers médicaux synthétiques pour développer des algorithmes sans compromettre la vie privée des patients. Les constructeurs de véhicules autonomes créent des millions de scénarios routiers incluant les conditions hivernales du Québec. Des institutions financières testent la détection de fraude sur des scénarios extrêmes.
💡 Le saviez-vous ?
Selon Gartner, d'ici 2030, les données synthétiques dépasseront les données réelles en volume pour l'entraînement des modèles d'IA. Elles peuvent parfois produire de meilleurs modèles que les données réelles, car elles permettent de corriger les biais et de représenter équitablement des situations rares.