Meituan entraîne un modèle IA massif sans Nvidia
Meituan a développé LongCat-2.0, un modèle d'IA de 1,6 trillion de paramètres entraîné exclusivement sur des puces chinoises. Le modèle surpasse certains modèles occidentaux sur des benchmarks comme SWE-bench Pro (59,5) mais reste en retard sur d'autres tests. Cette réalisation montre la capacité de la Chine à se passer de Nvidia.
« "LongCat-2.0 has demonstrated that we now have the capability to train large-scale models on domestic computing clusters," » — The Decoder
Que faut-il retenir ?
- LongCat-2.0 est un modèle d'IA de 1,6 trillion de paramètres.
- Le modèle a été entraîné sur un cluster de plus de 50 000 ASICs chinois.
- LongCat-2.0 surpasse Gemini 3.1 Pro et GPT-5.5 sur SWE-bench Pro (59,5) et SWE-bench Multilingual (77,3).
- Le modèle n'est pas encore disponible sur HuggingFace, rendant la vérification indépendante difficile.
Pourquoi cette nouvelle compte-t-elle ?
Cet article montre que la Chine peut désormais développer des modèles d'IA massifs sans dépendre des puces Nvidia, malgré les restrictions américaines. Cela pourrait influencer les stratégies technologiques mondiales et accélérer l'autonomie des pays en matière d'IA. Les professionnels doivent surveiller ces développements pour anticiper les changements dans l'écosystème de l'IA.
1,6 trillion de paramètres
Public concerné : développeurs, entreprises