Analyser la crise du droit d’auteur de l’IA générative
Analyser la crise du droit d’auteur de l’IA générative

Analyser la crise du droit d'auteur de l'IA générative
CODEIPPROMPT construit des invites à partir d'une collection de base de données de code source, et les programmes générés sont analysés par rapport aux fichiers source pour les scores de similarité. Crédit : CODEIPPROMPT : Évaluation des atteintes à la propriété intellectuelle des modèles de langage de code.

L'explosion récente d'outils d'intelligence artificielle tels que ChatGPT et Copilot a suralimenté l'assistance disponible pour les programmeurs. Cependant, les assistants IA peuvent supprimer les commentaires intégrés dans le code pour transmettre les directives de droit d'auteur et d'attribution, laissant les codeurs humains pas plus sages mais toujours légalement responsables de la violation de la propriété intellectuelle.

Pour lutter contre ce problème, des chercheurs en informatique et en ingénierie de la McKelvey School of Engineering de l'Université de Washington à St. Louis ont développé CodeIPPrompt, la première plate-forme de test automatisée pour évaluer la quantité de modèles de langage qui génèrent du code violant la propriété intellectuelle. L'équipe comprend Ning Zhang et Chenguang Wang, tous deux professeurs adjoints ; Yevgeniy Vorobeychik, professeur; Zhiyuan Yu, étudiant diplômé du laboratoire de Zhang et premier auteur de l'article ; et Chaowei Xiao, professeur adjoint d'informatique à l'Arizona State University.

Yu a présenté le travail le 23 juillet au Conférence internationale sur l'apprentissage automatique à Honolulu. Notamment, l'analyse de l'équipe a montré que les problèmes de violation du droit d'auteur sont répandus dans les modèles open source de pointe, notamment CodeRl, CodeGen et CodeParrot, ainsi que dans les produits commerciaux tels que Copilot, ChatGPT et GPT-4.

"Nous avons développé cet outil pour aider les gens à comprendre que s'ils utilisent ces grands modèles de langage pour aider à écrire du code, il y a de fortes chances qu'ils génèrent du contenu portant atteinte à la propriété intellectuelle", a déclaré Zhang. "En tant qu'utilisateurs, nous avons la responsabilité d'utiliser l'IA de manière éthique. Cela dépend de la façon dont nous comprenons la technologie de l'IA et le contenu qu'elle produit."

Bien que CodeIPPrompt ne puisse pas dire avec certitude si le code généré par l'IA constitue une violation de la propriété intellectuelle - Zhang note que ce problème est en fin de compte une question juridique qui se jouera devant les tribunaux lorsque des poursuites seront intentées contre les utilisateurs d'outils d'IA pour violation du droit d'auteur - il peut donner aux utilisateurs un score de risque qui indique dans quelle mesure le code généré est similaire au contenu protégé par des droits d'auteur. Zhang prévoit que l'outil aidera à guider le développement continu de l'IA et indiquera des stratégies d'atténuation potentielles et d'autres protections contre les violations de propriété intellectuelle à l'avenir.

Plus d'information: CODEIPPROMPT : Évaluation de la violation de la propriété intellectuelle des modèles de langage de code. openreview.net/pdf?id=zdmbZl0ia6

Fourni par l'Université de Washington à St. Louis

Citation: Analyse de la crise du droit d'auteur de l'IA générative (2023, 31 juillet) récupéré le 1er août 2023 sur

Ce document est soumis au droit d'auteur. En dehors de toute utilisation loyale à des fins d'étude ou de recherche privée, aucune partie ne peut être reproduite sans l'autorisation écrite. Le contenu est fourni seulement pour information.




Source

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Scroll to Top