Failles IA : 13 mots sur Reddit suffisent pour des arnaques
Une étude de Cornell Tech révèle que 13 mots stratégiques sur Reddit peuvent manipuler les réponses des IA génératives pour promouvoir des arnaques. Dans les tests, 38 à 51% des réponses contenaient des recommandations frauduleuses. Cette faille, nommée WARP, cible particulièrement les agents de recherche comme STORM et OmniThink.
« « Deep-Research Agents Can Be Poisoned Via User-Generated Content » » — Le Big Data
Que faut-il retenir ?
- 17 à 23% des pages analysées par les IA proviennent de plateformes participatives comme Reddit.
- 38 à 51% des réponses IA contenaient des recommandations frauduleuses après manipulation.
- Avec plusieurs appâts, le taux de réussite des arnaques montait à 62%.
- Gemini Deep Research citait 12% de sources manipulées contre 0,4% pour OpenAI Deep Research.
💬 Tingwei Zhang, Harold Triedman, Vitaly Shmatikov, Chercheurs à Cornell Tech
Public concerné : développeurs, entreprises
Comment vérifier la fiabilité des recommandations d'une IA générative ?
Toujours cliquer sur les sources citées par l'IA et croiser les informations. Méfiez-vous des recommandations urgentes ou trop précises. Privilégiez les plateformes avec modération humaine comme Wikipédia pour les recherches sensibles.