OpenAI déploie un robot d’exploration Web en préparation de GPT-5
OpenAI déploie un robot d’exploration Web en préparation de GPT-5

OpenAI a introduit un outil d'exploration Web nommé "GPTBot", visant à renforcer les capacités des futurs modèles GPT.

La société affirme que les données recueillies par GPTBot pourrait potentiellement améliorer la précision du modèle et étendre ses capacités, marquant une étape importante dans l'évolution des modèles de langage basés sur l'IA.

Les robots d'exploration Web - également appelés araignées Web - jouent un rôle central dans l'indexation du contenu sur la vaste étendue d'Internet. Des moteurs de recherche renommés tels que Google et Bing s'appuient sur ces robots pour remplir leurs résultats de recherche avec des pages Web pertinentes.

Le GPTBot d'OpenAI aura un objectif distinct : collecter des données accessibles au public tout en évitant soigneusement les sources qui impliquent des murs de paiement, la collecte de données personnelles ou du contenu qui contrevient aux politiques d'OpenAI.

Les propriétaires de sites Web ont la possibilité d'empêcher GPTBot d'explorer leurs sites simplement en implémentant une commande "interdire" dans un fichier de serveur standard. Cela leur permet de contrôler quelles parties de leur contenu sont accessibles au robot d'exploration Web.

L'annonce d'OpenAI suit de près la soumission par la société d'une demande de marque pour "GPT-5", qui devrait succéder au modèle GPT-4 actuel.

Le dépôt, effectué auprès de l'Office des brevets et des marques des États-Unis le 18 juillet, englobe l'utilisation de "GPT-5" dans la parole et le texte humains basés sur l'IA, la conversion audio-texte, la reconnaissance vocale et la synthèse vocale.

Cependant, alors que la demande de marque GPT-5 a suscité l'enthousiasme des passionnés d'IA, le PDG d'OpenAI, Sam Altman, a mis en garde contre les attentes prématurées. Altman a révélé que l'entreprise est encore loin d'avoir lancé la formation GPT-5, car des audits de sécurité approfondis doivent être menés avant de se lancer dans le processus.

Les efforts récents d'OpenAI n'ont pas été sans leur part de controverse. Des inquiétudes ont surgi concernant les pratiques de collecte de données de l'entreprise, en particulier en ce qui concerne les questions de droit d'auteur et de consentement.

En juin, le régulateur japonais de la confidentialité a émis un avertissement à OpenAI concernant la collecte de données non autorisée. Plus tôt cette année, l'Italie a temporairement interdit l'utilisation de ChatGPT en raison de violations présumées des lois sur la confidentialité de l'Union européenne.

OpenAI et Microsoft sont également actuellement confrontés un recours collectif déposé par 16 plaignants qui affirment que les informations privées des interactions des utilisateurs de ChatGPT ont été consultées sans le consentement approprié. Les entreprises ont également fait l'objet d'un procès contre GitHub Copilot, les demandeurs alléguant que l'outil de génération de code a enfreint les droits des développeurs en grattant leur code sans fournir l'attribution appropriée.

Si ces allégations s'avéraient vraies, OpenAI et Microsoft pourraient potentiellement être reconnus coupables d'avoir enfreint la loi sur la fraude et les abus informatiques, un précédent juridique pertinent pour les cas de grattage Web.

Alors qu'OpenAI continue de repousser les limites de la technologie de l'IA, elle doit relever ces défis pour assurer un développement responsable et éthique dans le paysage de l'IA.

(Crédit d'image : Gerd Altmann depuis Pixabay)

Voir également: Meta lance Llama 2 LLM open source

Vous voulez en savoir plus sur l'IA et le Big Data auprès des leaders de l'industrie ? Vérifier Salon de l'IA et du Big Data se déroulant à Amsterdam, en Californie et à Londres. L'événement est co-localisé avec Semaine de la transformation numérique.

Découvrez d'autres événements et webinaires technologiques d'entreprise à venir propulsés par TechForge ici.

  • Ryan Daws

    Ryan est rédacteur en chef chez TechForge Media avec plus d'une décennie d'expérience couvrant les dernières technologies et interviewant des personnalités de premier plan de l'industrie. Il peut souvent être aperçu lors de conférences techniques avec un café fort dans une main et un ordinateur portable dans l'autre. Si c'est geek, il est probablement dedans. Retrouvez-le sur Twitter (@Gadget_Ry) ou Mastodon (@gadgetry@techhub.social)

Mots clés: ai, intelligence artificielle, gpt-5, gptbot, openai, robot d'indexation, araignée web




Source

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Scroll to Top