GPT-5.5 rivalise avec Claude Mythos en tests de cyberattaques
Le GPT-5.5 d'OpenAI rivalise avec Claude Mythos Preview d'Anthropic dans des tests de cyberattaques menés par l'UK AI Security Institute. Les deux modèles ont réussi une simulation complexe d'attaque réseau, avec GPT-5.5 surpassant légèrement Claude Mythos sur des tâches expertes isolées.
Points clés
- GPT-5.5 atteint un taux de réussite de 71,4 % sur les tâches expertes, contre 68,6 % pour Claude Mythos Preview.
- GPT-5.5 a résolu complètement la simulation 'The Last Ones' en 2 tentatives sur 10, contre 3 pour Claude Mythos.
- AISI a testé GPT-5.5 avec 95 tâches de capture du drapeau, couvrant des niveaux de difficulté variés.
- Un jailbreak universel a contourné toutes les mesures de sécurité de GPT-5.5 en seulement six heures.
Pourquoi c'est important
Ces résultats montrent que les IA comme GPT-5.5 et Claude Mythos Preview sont capables de mener des cyberattaques complexes, ce qui soulève des préoccupations majeures en matière de sécurité. Les entreprises doivent être conscientes de ces capacités pour renforcer leurs défenses. Les jailbreaks restent une vulnérabilité critique, même pour les modèles les plus avancés.
Public concerné : entreprises
Quel est l'impact de GPT-5.5 sur la cybersécurité ?
GPT-5.5 démontre des capacités avancées en cyberattaques, réussissant des simulations complexes et surpassant Claude Mythos sur des tâches expertes, ce qui soulève des préoccupations majeures en matière de sécurité.
Commentaires (0)
Aucun commentaire pour le moment. Soyez le premier !