Nous avons formé des modèles de langage qui sont bien meilleurs pour suivre les intentions des utilisateurs que GPT-3 tout en les rendant plus véridiques et moins toxiques, en utilisant des techniques développées grâce à nos recherches sur l'alignement. Ces modèles InstructGPT, qui sont formés avec des humains dans la boucle, sont désormais déployés en tant que modèles de langage par défaut sur notre API.
Source