L'identification des minéraux est un problème complexe et chronophage pour les géologues, prenant souvent entre 30 minutes et plusieurs jours par échantillon. La situation est encore compliquée par le fait qu'une partie suffisante des minéraux reste insuffisamment étudiée, ce qui ne nous laisse que quelques centaines de minéraux entièrement caractérisés sur les 6 000 minéraux actuellement identifiés.
Le diagnostic visuel des minéraux et des roches est une pratique répandue en géologie, car elle est beaucoup moins coûteuse et plus rapide que d'autres méthodes, telles que la spectroscopie et l'analyse chimique. Cependant, cette méthode prend du temps et est moins précise que les méthodes plus coûteuses. Même les minéralogistes expérimentés peuvent commettre des erreurs lorsqu'ils travaillent avec un matériau rare ou un échantillon de mauvaise qualité. L'intégration de l'intelligence artificielle dans ce processus peut faciliter l'identification des erreurs et réduire le temps consacré aux tâches de routine par les experts.
Malgré les recherches en cours dans ce domaine, il existe un manque de référence claire pour l’analyse d’images minérales dans la littérature scientifique. Pour combler cette lacune, l'Institut de recherche sur l'intelligence artificielle, en collaboration avec Sber AI et l'Université d'État Lomonossov de Moscou, a créé un ensemble de données de référence pour les modèles de vision par ordinateur axés sur reconnaissance des minéraux.
Nous avons appelé l'ensemble de données MineralImage5k. Il est basé sur la collection du musée minéralogique Fersman et contient 44 000 échantillons. Bien que plus petit que l'ensemble de données Mindat, MineralImage5k offre une plus grande homogénéité des conditions photographiques et se compose d'échantillons non traités qui ressemblent beaucoup à des minéraux naturels.
L'ensemble de données MineralImage5k est divisé en trois sous-ensembles de complexité variable, ce qui met les chercheurs au défi en matière de classification, de segmentation et d'estimation de la taille des minéraux. La tâche de classification la plus simple présentée dans le benchmark contient dix espèces minérales avec au moins 462 exemples par espèce. Le problème le plus délicat est de classer les minéraux en classes 5K avec une seule image disponible par classe.
Un problème auquel l’IA peut être confrontée lorsqu’elle travaille avec des photos d’un minéral est de savoir quelle partie de la roche présentée est un véritable minéral d’intérêt. Pour résoudre ce problème, nous partageons un ensemble distinct d'environ 100 images avec des étiquettes supplémentaires et la tâche de segmentation en plus de la classification. L'intégration de la tâche de segmentation dans le pipeline de classification peut fournir des informations supplémentaires dans les cas où le modèle commet des erreurs et réduire le nombre de telles situations.
Au-delà de la classification et de la segmentation, nous étudions l’estimation de la taille des minéraux à partir de zéros. L’estimation automatique de la taille des spécimens pourrait être très utile pour les procédures de stockage des spécimens dans les musées. Disposant de ces données pour tous les échantillons, nous pouvons planifier le système de stockage optimal et acheter ou fabriquer des boîtes de la bonne taille dans la bonne quantité. Par conséquent, nous fournissons plus de 18 000 échantillons étiquetés pour la tâche de régression dans notre benchmark.
Pour démontrer l'efficacité du benchmark, nous avons évalué un modèle de langage de vision pré-entraîné sur des données de domaine général. Nous avons constaté qu'affiner le modèle sur un ensemble de données spécifique à un domaine tel que MineralImage5k peut améliorer considérablement sa précision. Nous soulignons également le potentiel prometteur de l’évaluation d’ensembles de données croisées pour évaluer les modèles de reconnaissance des minéraux.
Notre recherche est publiée dans la revue Informatique et géosciences. Nous sommes heureux de vous aider à utiliser l'ensemble de données et le benchmark, et nous invitons tous les chercheurs intéressés à partager leurs idées pour le rendre plus utile à la communauté.
Cette histoire fait partie de Dialogue Science Xoù les chercheurs peuvent rendre compte des résultats de leurs articles de recherche publiés. Visitez cette page pour plus d’informations sur ScienceX Dialog et comment y participer.
Plus d'information: Sergey Nesteruk et al, MineralImage5k : Une référence pour la reconnaissance visuelle et la description des minéraux bruts sans tir, Informatique et géosciences (2023). DOI : 10.1016/j.cageo.2023.105414
Artur Kadurin est l'ancien directeur de l'IA chez Insilico Medicine, une entreprise utilisant des techniques d'apprentissage profond pour la découverte de médicaments et la recherche sur le vieillissement. Il dirige désormais le groupe de recherche « DL in Life Sciences » à l'Artificial Intelligence Research Institute, AIRI. Lui et son collègue Denis Dimitrov peuvent être contactés par e-mail (kadurin@airi.net, dimitrov@airi.net) si vous avez besoin d'aide pour mener vos expériences sur leurs données.
Citation: La minéralogie rencontre la vision par ordinateur sans tir (25 août 2023) récupéré le 25 août 2023 sur
Ce document est soumis au droit d'auteur. En dehors de toute utilisation équitable à des fins d'étude ou de recherche privée, aucune partie ne peut être reproduite sans autorisation écrite. Le contenu est fourni seulement pour information.
Source