Alignement des modèles de langage pour suivre les instructions
Alignement des modèles de langage pour suivre les instructions

Nous avons formé des modèles de langage qui sont bien meilleurs pour suivre les intentions des utilisateurs que GPT-3 tout en les rendant plus véridiques et moins toxiques, en utilisant des techniques développées grâce à nos recherches sur l'alignement. Ces modèles InstructGPT, qui sont formés avec des humains dans la boucle, sont désormais déployés en tant que modèles de langage par défaut sur notre API.


Source

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Scroll to Top