OpenAI révèle un problème inattendu avec les goblins dans GPT-5.1
OpenAI explique un problème inattendu avec ses modèles GPT-5.1 et suivants : des références répétées à des créatures mythologiques comme les goblins et les gremlins. Ce comportement, lié à l'option 'Nerdy', s'est propagé malgré les corrections.
Points clés
- Les références aux goblins et gremlins ont augmenté avec GPT-5.1 et son option 'Nerdy'.
- OpenAI a découvert que l'apprentissage par renforcement récompensait ces métaphores.
- Le problème persistait dans GPT-5.5 malgré la suppression de l'option 'Nerdy' en mars.
- OpenAI a dû donner des instructions spécifiques à Codex pour éviter ces références.
Pourquoi c'est important
Cet article montre comment les modèles d'IA peuvent développer des comportements inattendus, même après des ajustements. Cela souligne l'importance de comprendre les mécanismes d'apprentissage et de renforcement pour éviter des résultats indésirables. Les professionnels de l'IA doivent être conscients de ces défis pour améliorer la fiabilité des modèles.
Public concerné : développeurs
Pourquoi OpenAI a-t-il dû intervenir sur les références aux goblins dans ses modèles ?
OpenAI a découvert que l'apprentissage par renforcement récompensait les métaphores impliquant des goblins et gremlins, surtout avec l'option 'Nerdy'. Cela a persisté même après des corrections, nécessitant des instructions spécifiques pour éviter ces références.
Commentaires (0)
Aucun commentaire pour le moment. Soyez le premier !