Modéliser les comportements sur les réseaux sociaux pour lutter contre la désinformation : un cadre linguistique universel
Modéliser les comportements sur les réseaux sociaux pour lutter contre la désinformation : un cadre linguistique universel

Modéliser les comportements sur les réseaux sociaux pour lutter contre la désinformation
Illustrations de chaînes d'action BLOC pour un compte Twitter humain, cyborg et robot illustrant certaines différences de comportement entre ces individus. Crédit : CC BY 4.0. Nwala et coll.

Tous ceux avec qui vous n'êtes pas d'accord sur les réseaux sociaux ne sont pas des robots, mais diverses formes de manipulation des réseaux sociaux sont en effet utilisées pour diffuser de faux récits, influencer les processus démocratiques et affecter les cours des actions.

En 2019, le coût mondial des mauvais acteurs sur Internet était estimé à 78 milliards de dollars. Entre-temps, les stratégies de désinformation n’ont cessé d’évoluer : leur détection a jusqu’à présent été une affaire réactive, les acteurs malveillants ayant toujours une longueur d’avance.

Alexander Nwala, professeur adjoint de science des données chez William & Mary, vise à lutter de manière proactive contre ces formes d'abus. Avec des collègues de l'Observatoire des médias sociaux de l'Université d'Indiana, il a récemment publié un article dans Science des données EPJ pour présenter BLOC, un cadre linguistique universel pour modéliser les comportements sur les réseaux sociaux.

"L'idée principale derrière ce cadre n'est pas de cibler un comportement spécifique, mais plutôt de fournir un langage capable de décrire les comportements", a déclaré Nwala.

Les robots automatisés imitant les actions humaines sont devenus plus sophistiqués au fil du temps. Un comportement coordonné inauthentique représente une autre tromperie courante, qui se manifeste par des actions qui peuvent ne pas sembler suspectes au niveau d'un compte individuel, mais qui font en réalité partie d'une stratégie impliquant plusieurs comptes.

Cependant, tous les comportements automatisés ou coordonnés ne sont pas nécessairement malveillants. BLOC ne classe pas les activités « bonnes » ou « mauvaises », mais donne aux chercheurs un langage pour décrire les comportements sur les réseaux sociaux, sur la base duquel les actions potentiellement malveillantes peuvent être plus facilement identifiées.

Un outil convivial permettant d'enquêter sur les comportements suspects des comptes est en préparation chez William & Mary. Ian MacDonald '25, directeur technique du DisinfoLab dirigé par W&M, construit un site Web basé sur BLOC qui serait accessible aux chercheurs, aux journalistes et au grand public.

Vérification de l'automatisation et de la coordination

Le processus, a expliqué Nwala, commence par l'échantillonnage des publications d'un compte de réseau social donné dans un laps de temps spécifique et le codage des informations à l'aide d'alphabets spécifiques.

BLOC, qui signifie « Langages comportementaux pour la caractérisation en ligne », s'appuie sur des alphabets d'action et de contenu pour représenter le comportement des utilisateurs d'une manière qui peut être facilement adaptée aux différentes plateformes de médias sociaux.

Par exemple, une chaîne comme « TpπR » indique une séquence de quatre actions de l'utilisateur : spécifiquement, un message publié, une réponse à un non-ami puis à lui-même et une republication du message d'un ami.

En utilisant l'alphabet de contenu, le même ensemble d'actions peut être caractérisé comme "

Les chaînes BLOC obtenues sont ensuite tokenisées en mots pouvant représenter différents comportements. "Une fois que nous avons ces mots, nous construisons ce que nous appelons des vecteurs, des représentations mathématiques de ces mots", a expliqué Nwala. "Nous aurons donc différents mots BLOC, puis le nombre de fois où un utilisateur a exprimé le mot ou le comportement."

Une fois les vecteurs obtenus, les données sont analysées via un algorithme d'apprentissage automatique entraîné pour identifier des modèles distinguant les différentes classes d'utilisateurs (par exemple, les machines et les humains).

Les comportements humains et ceux de type robot se situent aux extrémités opposées d'un spectre : entre les deux, il y a des comptes "de type cyborg" qui oscillent entre les deux.

"Nous créons des modèles qui capturent le comportement des machines et des humains, puis nous déterminons si les comptes inconnus sont plus proches des humains ou des machines", a déclaré Nwala.

L’utilisation du framework BLOC ne facilite pas seulement la détection des robots, égalant ou surpassant les méthodes de détection actuelles ; cela permet également d’identifier des similitudes entre les comptes gérés par des humains. Nwala a souligné que le BLOC avait également été appliqué pour détecter des comptes inauthentiques coordonnés se livrant à des opérations d'information provenant de pays qui tentaient d'influencer les élections aux États-Unis et en Occident.

"La similarité est une mesure très utile", a-t-il déclaré. "Si deux comptes font presque la même chose, vous pouvez enquêter sur leurs comportements à l'aide de BLOC pour voir s'ils sont contrôlés par la même personne, puis enquêter plus en détail sur leur comportement."

BLOC est jusqu’à présent unique dans la lutte contre différentes formes de manipulation et est bien placé pour survivre aux changements de plate-forme qui peuvent rendre obsolètes les outils de détection populaires.

"De plus, si une nouvelle forme de comportement apparaît et que nous souhaitons l'étudier, nous n'avons pas besoin de repartir de zéro", a déclaré Nwala. "Nous pouvons simplement utiliser BLOC pour étudier ce comportement et éventuellement le détecter."

Au-delà des mauvais acteurs en ligne

Comme Nwala le souligne aux étudiants de son cours de science du Web – la science des structures d’information décentralisées – l’étude des outils et technologies Web doit prendre en compte les dimensions sociales, culturelles et psychologiques.

"À mesure que nous interagissons avec les technologies, toutes ces forces se conjuguent", a-t-il déclaré.

Nwala a suggéré de futures applications potentielles du BLOC dans des domaines tels que la santé mentale, car le cadre soutient l'étude des changements de comportement dans les actions sur les réseaux sociaux.

Les travaux de recherche sur les médias sociaux ont toutefois été récemment limités par les restrictions imposées par les plateformes de médias sociaux sur les interfaces de programmation d’applications.

"De telles recherches n'ont été possibles que grâce à la disponibilité d'API permettant de collecter de grandes quantités de données", a déclaré Nwala. "Les manipulateurs pourront se permettre tout ce qu'il faut pour continuer leurs comportements, mais pas les chercheurs de l'autre côté."

Selon Nwala, ces limitations n’affectent pas seulement les chercheurs, mais également la société dans son ensemble, car ces études contribuent à sensibiliser à la manipulation des médias sociaux et contribuent à l’élaboration de politiques efficaces.

"Tout comme il y a eu des cris constants sur la façon dont le lent déclin des médias d'information locaux affecte le processus démocratique, je pense que cela atteint ce niveau", a-t-il déclaré. "La capacité des chercheurs de bonne foi à collecter et analyser des données sur les réseaux sociaux à grande échelle est un bien public qui ne doit pas être restreint."

Plus d'information: Alexander C. Nwala et al, Un cadre linguistique pour modéliser le comportement des comptes de médias sociaux, Science des données EPJ (2023). DOI : 10.1140/epjds/s13688-023-00410-9

Fourni par William et Mary

Citation: Modéliser les comportements sur les réseaux sociaux pour lutter contre la désinformation : un cadre linguistique universel (15 septembre 2023) récupéré le 15 septembre 2023 sur

Ce document est soumis au droit d'auteur. En dehors de toute utilisation équitable à des fins d'étude ou de recherche privée, aucune partie ne peut être reproduite sans autorisation écrite. Le contenu est fourni seulement pour information.




Source

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Scroll to Top