Microsoft Lens : un modèle text-to-image efficace avec légendes détaillées
Microsoft Research présente Lens, un modèle text-to-image qui rivalise avec des modèles plus grands tout en utilisant un cinquième de la puissance de calcul. Avec seulement 3,8 milliards de paramètres, il surpasse des modèles comme Hunyuan-Image-3.0 (80 milliards de paramètres) grâce à des légendes détaillées et une architecture intelligente.