Test-time compute
Test-time compute (calcul à l'inférence)
📖 Définition
💬 En termes simples
C'est le passage du « réponse instantanée » au « laisse-moi réfléchir 30 secondes » qui change la qualité de la réponse.
🎯 Exemple concret
Une équipe de R&D pharmaceutique à Laval configure son LLM pour allouer 60 secondes de raisonnement par requête sur les analyses moléculaires — coût quadruplé, qualité doublée selon leurs benchmarks internes.
💡 Le saviez-vous ?
En 2026, plusieurs labs estiment que le test-time compute pourrait sextupler la performance des modèles sans augmenter leur taille — un changement de paradigme aussi important que le passage à l'apprentissage profond.