📖 Définition

L'attaque par extraction de modèle vise à reconstituer un modèle d'IA propriétaire en l'interrogeant massivement via son API publique. L'attaquant collecte des milliers ou des millions de paires (entrée, sortie) et entraîne un modèle élève qui imite le comportement de l'original. Avec des techniques modernes de distillation, un attaquant peut reproduire 90 % de la performance d'un GPT-4 propriétaire pour quelques milliers de dollars d'appels API. Pour une PME québécoise qui commercialise un modèle entraîné sur ses données métier, c'est une menace de propriété intellectuelle directe — d'où l'importance du rate limiting, watermarking et détection d'anomalies.

💬 En termes simples

C'est goûter un plat 10 000 fois pour reconstituer la recette secrète sans avoir accès aux fiches du chef.

🎯 Exemple concret

Une firme québécoise de scoring assurantiel détecte un pic d'appels API anormal depuis trois IP : 8 millions de requêtes en deux semaines. Un concurrent tentait de cloner le modèle pour 4 000 $ d'appels, contre 300 000 $ pour le réentraîner.

💡 Le saviez-vous ?

En 2026, plusieurs chercheurs ont montré qu'on peut extraire l'embedding layer complet d'un modèle de fondation propriétaire pour moins de 100 $ d'appels API — la propriété intellectuelle des LLM est plus fragile qu'on le pense.

Navigation

Ressources

Pages

Vol de modèle

Vol de modèle

📖 Définition

💬 En termes simples

🎯 Exemple concret

💡 Le saviez-vous ?

Ressources

À propos

Communauté

Reste à jour en veille IA

Confirmer

Navigation

Ressources

Pages

Vol de modèle

Vol de modèle

📖 Définition

💬 En termes simples

🎯 Exemple concret

💡 Le saviez-vous ?

Termes associés