Le pouvoir de l’apprentissage continu
Le pouvoir de l’apprentissage continu

Au cours de mes 2,5 premières années chez OpenAI, j'ai travaillé dans l'équipe de robotique sur une idée lunaire : nous voulions apprendre à une seule main de robot ressemblant à un humain à résoudre le Rubik's cube. Ce fut une expérience extrêmement excitante, stimulante et émouvante. Nous résolu le défi avec l'apprentissage par renforcement profond (RL), des quantités folles de randomisation de domaine et aucune donnée de formation réelle. Plus important encore, nous avons relevé le défi en équipe.

De la simulation et de la formation RL à la perception visuelle et au micrologiciel matériel, nous avons collaboré si étroitement et de manière cohérente. C'était une expérience incroyable et pendant ce temps, j'ai souvent pensé à Steve Jobs champ de distorsion de la réalité: lorsque vous croyez si fort en quelque chose et que vous continuez à le faire avec tant de persévérance, vous pouvez en quelque sorte rendre l'impossible possible.

Depuis début 2021, j'ai commencé à diriger l'équipe de recherche appliquée en IA. La gestion d'une équipe présente un ensemble de défis différents et nécessite des changements de style de travail. Je suis le plus fier de plusieurs projets liés à la sécurité des modèles de langage au sein d'Applied AI :

  1. Nous avons conçu et construit un ensemble de données et de tâches d'évaluation pour évaluer la tendance des modèles linguistiques pré-formés à générer du contenu haineux, sexuel ou violent.
  2. Nous avons créé une taxonomie détaillée et construit un classificateur puissant pour détecter le contenu indésirable ainsi que la raison pour laquelle le contenu est inapproprié.
  3. Nous travaillons sur diverses techniques pour rendre le modèle moins susceptible de générer des sorties dangereuses.

Alors que l'équipe d'Applied AI met en pratique la meilleure façon de déployer des techniques d'IA de pointe, telles que de grands modèles de langage pré-formés, nous voyons à quel point ils sont puissants et utiles pour les tâches du monde réel. Nous sommes également conscients de l'importance de déployer les techniques en toute sécurité, comme souligné dans notre Charte.




Source

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Scroll to Top