Un modèle pour identifier automatiquement la polarité des sentiments de mots spécifiques dans des textes écrits
Un modèle pour identifier automatiquement la polarité des sentiments de mots spécifiques dans des textes écrits

Un modèle pour identifier automatiquement la polarité des sentiments de mots spécifiques dans des textes écrits
L'architecture sous-jacente du LMIAN créé par les chercheurs. Crédit : Zheng et al. (Connexion scientifique, 2023).

Ces dernières années, les informaticiens ont essayé de développer des modèles efficaces pour l'analyse des sentiments. Ces modèles sont conçus pour analyser des phrases ou des textes plus longs et déterminer de manière autonome leur ton émotionnel sous-jacent.

En plus d'exprimer un ton émotionnel global, les textes peuvent contenir des mots individuels chargés d'émotions positives ou négatives, ainsi que des mots neutres. Par exemple, si nous nous plaignons de quelque chose, le mot décrivant la chose en question sera très probablement chargé d'une émotion négative.

La tâche consistant à identifier la « polarité des sentiments » (c'est-à-dire les connotations émotionnelles négatives ou positives) de mots spécifiques dans une phrase est connue sous le nom d'analyse des sentiments basée sur les aspects (ABSA). Bien que cette tâche puisse être intuitive et simple pour les humains, elle peut être beaucoup plus difficile à réaliser à l'aide de modèles informatiques.

Des chercheurs de l'Université des sciences et technologies d'Anhui en Chine ont récemment développé un nouveau modèle conçu pour accomplir efficacement les tâches ABSA. Ce modèle, présenté dans un article de Sciences de la connexionest basé sur un algorithme d'apprentissage automatique connu sous le nom de réseau d'attention interactif multicouche léger (LMIAN).

"Les études existantes ont reconnu la valeur de l'apprentissage interactif dans l'ABSA et ont développé diverses méthodes pour modéliser avec précision les mots d'aspect et leurs contextes grâce à l'apprentissage interactif", ont écrit Wenjun Zheng, Shunxiang Zhang et leurs collègues dans leur article. "Cependant, ces méthodes utilisent principalement une méthode interactive peu profonde pour modéliser les mots d'aspect et leurs contextes, ce qui peut conduire à un manque d'informations complexes sur les sentiments. Pour résoudre ce problème, nous proposons un réseau d'attention interactif multicouche léger (LMIAN) pour ABSA."

Les réseaux d'attention interactifs peuvent apprendre à prêter attention à des mots spécifiques dans une phrase via un mécanisme d'attention, qui leur permet de lier ces mots au contexte linguistique global dans lequel ils se trouvent. Dans le cadre de leur étude récente, Zheng, Zhang et leurs collègues ont formé l'un de ces modèles pour apprendre spécifiquement les informations émotionnelles complexes cachées dans un texte, afin qu'il puisse ensuite détecter la polarité des sentiments de mots spécifiques.

"Nous utilisons d'abord un modèle de langage pré-formé pour initialiser les vecteurs d'incorporation de mots", ont écrit Zheng, Zhang et leurs collègues dans leur article. "Deuxièmement, une couche de calcul interactive est conçue pour établir des corrélations entre les mots d'aspect et leurs contextes. Un tel degré de corrélation est calculé par plusieurs couches de calcul avec des modèles d'attention neuronale. Troisièmement, nous utilisons une stratégie de partage de paramètres entre les couches de calcul. Cela permet au modèle pour apprendre des fonctionnalités de sentiment complexes avec des coûts de mémoire inférieurs."

Les chercheurs ont formé et évalué leur modèle à l'aide de six ensembles de données d'analyse des sentiments accessibles au public contenant des textes en chinois et en anglais. Ces textes sont essentiellement des avis en ligne de produits ou de services, avec un objet associé et une étiquette de sentiment (c'est-à-dire positif, négatif ou neutre), qui ont finalement permis à l'équipe de former leur modèle.

Lors des premières évaluations de ces ensembles de données, le LMIAN de l'équipe a obtenu des résultats très prometteurs, identifiant la polarité des sentiments des mots dans les phrases avec une précision supérieure à 90 %, tout en consommant moins de mémoire GPU que les autres réseaux. À l'avenir, ses performances pourraient encore être améliorées et il pourrait également être intégré à d'autres outils d'analyse de texte et de sentiment.

"Des expériences approfondies ont prouvé que notre LMIAN atteint un meilleur équilibre entre les performances, la taille et la consommation de mémoire GPU du modèle", ont conclu Zheng, Zhang et leurs collègues dans leur article. "À l'avenir, nous optimiserons davantage notre modèle d'attention interactive pour obtenir des performances plus élevées et une consommation de mémoire GPU réduite. L'une de nos idées est d'effectuer une interaction profonde des caractéristiques locales avec des mots d'aspect pour améliorer les performances du modèle en réduisant les informations d'interférence."

Plus d'information: Wenjun Zheng et al, Réseau d'attention interactif multicouche léger pour l'analyse des sentiments basée sur les aspects, Sciences de la connexion (2023). DOI : 10.1080/09540091.2023.2189119

© 2023 Réseau Science X

Citation: Un modèle pour identifier automatiquement la polarité des sentiments de mots spécifiques dans des textes écrits (2023, 21 avril) récupéré le 21 avril 2023 sur

Ce document est soumis au droit d'auteur. En dehors de toute utilisation loyale à des fins d'étude ou de recherche privée, aucune partie ne peut être reproduite sans l'autorisation écrite. Le contenu est fourni seulement pour information.




Source

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Scroll to Top