Estimation de poses et de formes 3D multi-personnes à partir d’une image basse résolution
Estimation de poses et de formes 3D multi-personnes à partir d’une image basse résolution

par KeAi Communications Co.

Estimation de poses et de formes 3D multi-personnes à partir d'une image basse résolution
En utilisant une image basse résolution capturée par un téléphone portable ou échantillonnée à partir d'un ensemble de données de grande scène, la nouvelle méthode MILI (inférence multi-personnes à partir d'une image basse résolution) peut obtenir une reconstruction multi-personnes plus précise par rapport à un état- méthode de l'art (SOTA). Crédit : les auteurs

L'estimation précise des poses 3D et des formes corporelles à partir d'une seule image est essentielle pour plusieurs applications, telles que l'analyse du comportement et les alertes de sécurité. Malheureusement, de nombreuses méthodes de reconstruction multi-personnes existantes nécessitent que les personnes présentes soient clairement visibles sur la photo pour fournir suffisamment d'informations. Cela devient un problème lorsque les caméras ont des résolutions limitées et que le champ de vision est augmenté pour capturer des individus dans des zones éloignées, ce qui donne des images à basse résolution qui fournissent peu d'informations.

Pour remédier à cette limitation, une équipe de recherche de l'Université de Tianjin et de l'Université de Cardiff a tenté de concilier le conflit entre la résolution de l'image et la précision de l'estimation. Tel que rapporté dans le journal KeAi Recherche fondamentalel'équipe a proposé un cadre d'apprentissage automatique multitâche de bout en bout connu sous le nom de MILI (inférence multi-personnes à partir d'une image basse résolution) qui permet une représentation précise des poses et des formes 3D multi-personnes à partir d'une image basse résolution.

De plus, pour résoudre le problème d'occlusion dans les scènes à plusieurs personnes, les chercheurs ont conçu un réseau de prédiction de masque sensible à l'occlusion pour estimer le masque du maillage de chaque personne pendant la régression. Des images par paires à haute et basse résolution ont également été utilisées pour la formation.

"Dans les scènes à petite et à grande échelle, MILI a surpassé les méthodes de pointe à la fois quantitativement et qualitativement", a déclaré Kun Li, auteur principal de l'étude. "Différent des travaux existants, MILI, en tant que réseau de bout en bout, encourage la reconstruction multi-personnes même à partir d'images basse résolution et améliore considérablement la robustesse aux occlusions avec le réseau de prédiction de masque conscient de l'occlusion en affinant l'étape de détection avec segmentation."

Le code est disponible ici.

"La reconstruction de poses et de formes 3D pour les individus dans une scène de surveillance permettra une meilleure reconnaissance des actions/activités, y compris l'interaction entre les personnes, la modélisation du comportement de la foule pour les simulations et la surveillance de la sécurité, et un meilleur suivi des individus au fil du temps", a conclu Li .

Plus d'information: Kun Li et al, MILI : Inférence multi-personnes à partir d'une image basse résolution, Recherche fondamentale (2023). DOI : 10.1016/j.fmre.2023.02.006

Fourni par KeAi Communications Co.

Citation: Estimation de poses et de formes 3D multi-personnes à partir d'une image basse résolution (17 avril 2023) récupérée le 23 avril 2023 sur

Ce document est soumis au droit d'auteur. En dehors de toute utilisation loyale à des fins d'étude ou de recherche privée, aucune partie ne peut être reproduite sans l'autorisation écrite. Le contenu est fourni seulement pour information.




Source

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Scroll to Top