Claude Fable 5 surpasse GPT-5.5 en maths
Le modèle Claude Fable 5 d'Anthropic atteint 87% de précision sur les niveaux 1 à 3 et 88% sur le niveau 4 de FrontierMath, dépassant GPT-5.5 de 13 points. Ce benchmark est considéré comme l'un des plus difficiles pour le raisonnement mathématique des IA.
« Claude Fable 5 hits 87 percent accuracy on tiers 1 through 3 and 88 percent on the hardest tier 4 » — The Decoder
Que faut-il retenir ?
- Claude Fable 5 atteint 87% de précision sur les niveaux 1 à 3 de FrontierMath
- Le modèle obtient 88% de précision sur le niveau 4, le plus difficile
- GPT-5.5 d'OpenAI atteint environ 75% sur le même niveau
- Le modèle précédent Opus 4.5 avait moins de 10% de précision début 2026
Pourquoi cette nouvelle compte-t-elle ?
Ces performances démontrent une avancée significative en raisonnement mathématique pour les IA, avec des implications pour la recherche scientifique et l'éducation. La supériorité de Claude Fable 5 pourrait influencer le choix des modèles pour les applications techniques et académiques exigeantes.
88% de précision sur le niveau 4 de FrontierMath
Public concerné : développeurs, entreprises
Quel modèle IA est actuellement le plus performant en raisonnement mathématique ?
Claude Fable 5 d'Anthropic est le plus performant avec 88% de précision sur le benchmark FrontierMath, surpassant GPT-5.5 de 13 points selon les tests d'Epoch AI. Ce modèle montre des progrès rapides puisque son prédécesseur avait moins de 10% de précision début 2026.