Un récent article de perspective publié dans Ingénierie propose une nouvelle façon d'évaluer l'intelligence générale artificielle (AGI) avec l'introduction du test de Tong (où « Tong » correspond à la prononciation du caractère chinois de « général », comme dans « intelligence générale artificielle »). Cette approche innovante vise à fournir un système d'évaluation standardisé, quantitatif et objectif pour l'AGI en se concentrant sur les interactions physiques et sociales incarnées dynamiques (DEPSI).
Les progrès rapides de la série de transformateurs génératifs pré-entraînés (GPT) ont placé AGI à l'avant-garde du domaine de l'intelligence artificielle (IA). Cependant, définir et évaluer l’AGI reste un défi. Le test de Tong offre une nouvelle perspective sur l'évaluation de l'AGI en soulignant l'importance du DEPSI en tant que cadre.
Traditionnellement, les critères d’évaluation de l’IA sont axés sur les tâches, mais le test de Tong se concentre désormais sur des évaluations axées sur les capacités et les valeurs. La plate-forme virtuelle proposée dans le test Tong prend en charge l'IA incarnée dans la formation et les tests, permettant aux agents d'IA d'acquérir des informations, d'apprendre et d'affiner leurs valeurs et leurs capacités de manière interactive.
Le test de Tong propose cinq caractéristiques critiques qui peuvent servir de références AGI : tâches infinies, génération de tâches autonome, alignement des valeurs, compréhension causale et incarnation. Ces caractéristiques constituent la base d'un système d'évaluation systémique qui permet de définir les jalons de l'AGI à travers un environnement virtuel avec DEPSI.
Contrairement aux systèmes de test d'IA classiques, le test de Tong propose une approche d'évaluation plus complète et inclusive. Il combine un paradigme de test algorithmique général avec un paradigme de test basé sur l'interaction homme-IA, s'inspirant de la philosophie du test de Turing. La plate-forme virtuelle du test Tong génère des tâches illimitées avec des scénarios d'interaction dynamiques incarnés, couvrant diverses dimensions de capacités et de valeurs.
La plateforme de test Tong intègre des composants essentiels tels que l'infrastructure, les environnements DEPSI et les outils d'évaluation. Cette combinaison offre une voie pratique pour construire une plate-forme incarnée avec des tâches infinies, où les algorithmes d’IA peuvent être évalués sur site avec des interactions humaines.
En introduisant le test de Tong, cet article de perspective ouvre la voie à un système d'évaluation standardisé et objectif pour l'AGI. Il propose des conseils théoriques pour le développement d’algorithmes d’IA tout en soulignant l’importance du DEPSI dans l’évaluation de l’AGI.
Les auteurs de l'article de perspective estiment que le test de Tong a le potentiel de faire avancer le domaine de l'évaluation de l'AGI en promouvant des références standardisées, quantitatives et objectives. Cela contribuera non seulement au développement ultérieur de l’AGI, mais favorisera également une plus grande transparence et une plus grande compréhension au sein de la communauté de l’IA.
Plus d'information: Yujia Peng et al, Le test de Tong : évaluation de l'intelligence générale artificielle à travers des interactions physiques et sociales incarnées dynamiques, Ingénierie (2023). DOI : 10.1016/j.eng.2023.07.006
Fourni par l'ingénierie
Citation: Le test de Tong : Une nouvelle approche pour évaluer l'intelligence artificielle générale (2023, 21 septembre) récupéré le 21 septembre 2023 sur
Ce document est soumis au droit d'auteur. En dehors de toute utilisation équitable à des fins d'étude ou de recherche privée, aucune partie ne peut être reproduite sans autorisation écrite. Le contenu est fourni seulement pour information.
Source