

Fournisseur LLM open source MosaicML a annoncé la sortie de ses modèles les plus avancés à ce jour, le MPT-30B Base, instruire et discuter.
Ces modèles à la pointe de la technologie ont été formés sur la plate-forme MosaicML à l'aide des accélérateurs H100 de dernière génération de NVIDIA et prétendent offrir une qualité supérieure par rapport au modèle GPT-3 d'origine.
Avec MPT-30B, les entreprises peuvent tirer parti de la puissance de l'IA générative tout en préservant la confidentialité et la sécurité des données.
Depuis leur lancement en mai 2023, les modèles MPT-7B ont gagné en popularité, avec plus de 3,3 millions de téléchargements. Les nouveaux modèles MPT-30B offrent une qualité encore supérieure et ouvrent de nouvelles possibilités pour diverses applications.
Les modèles MPT de MosaicML sont optimisés pour une formation et une inférence efficaces, permettant aux développeurs de créer et de déployer facilement des modèles de niveau entreprise.
L'une des réalisations notables du MPT-30B est sa capacité à surpasser la qualité du GPT-3 tout en n'utilisant que 30 milliards de paramètres, contre 175 milliards pour le GPT-3. Cela rend MPT-30B plus accessible pour fonctionner sur du matériel local et nettement moins cher à déployer pour l'inférence.

Le coût de la formation de modèles personnalisés basés sur MPT-30B est également considérablement inférieur aux estimations de formation du GPT-3 d'origine, ce qui en fait une option attrayante pour les entreprises.
De plus, MPT-30B a été formé sur des séquences plus longues allant jusqu'à 8 000 jetons, ce qui lui permet de gérer des applications d'entreprise gourmandes en données. Ses performances sont soutenues par l'utilisation des GPU H100 de NVIDIA, qui offrent un débit accru et des temps de formation plus rapides.
Plusieurs entreprises ont déjà adopté les modèles MPT de MosaicML pour leurs applications d'IA.
Replierun IDE basé sur le Web, a créé avec succès un modèle de génération de code à l'aide de ses données propriétaires et de la plate-forme de formation de MosaicML, ce qui a permis d'améliorer la qualité, la vitesse et la rentabilité du code.
Laboratoire de dispersionune startup d'IA spécialisée dans le développement de chatbots, a formé son propre modèle MPT pour créer un modèle d'IA génératif multilingue capable de comprendre l'anglais et le coréen, améliorant ainsi les expériences de chat pour sa base d'utilisateurs.
Navanune société mondiale de logiciels de gestion des voyages et des dépenses, s'appuie sur la fondation MPT pour développer des LLM personnalisés pour des applications telles que les agents de voyages virtuels et les agents de veille économique conversationnelle.
Ilan Twig, cofondateur et directeur technique de Navan, a déclaré :
« Chez Navan, nous utilisons l'IA générative dans nos produits et services, alimentant des expériences telles que notre agent de voyage virtuel et notre agent de veille économique conversationnel.
Les modèles de base de MosaicML offrent des capacités de langage de pointe tout en étant extrêmement efficaces pour affiner et servir l'inférence à grande échelle. »
Les développeurs peuvent accéder au MPT-30B via le HuggingFace Hub en tant que modèle open source. Ils ont la possibilité d'affiner le modèle sur leurs données et de le déployer pour inférence sur leur infrastructure.
Alternativement, les développeurs peuvent utiliser le point de terminaison géré de MosaicML, MPT-30B-Instruct, qui offre une inférence de modèle sans tracas à une fraction du coût par rapport à des points de terminaison similaires. À 0,005 $ pour 1 000 jetons, MPT-30B-Instruct fournit une solution rentable pour les développeurs.
La sortie par MosaicML des modèles MPT-30B marque une avancée significative dans le domaine des grands modèles de langage, permettant aux entreprises d'exploiter les capacités de l'IA générative tout en optimisant les coûts et en gardant le contrôle sur leurs données.
(Photo par Josué Golde sur Unsplash)

Vous voulez en savoir plus sur l'IA et le Big Data auprès des leaders de l'industrie ? Vérifier Salon de l'IA et du Big Data se déroulant à Amsterdam, en Californie et à Londres. L'événement est co-localisé avec Semaine de la transformation numérique.
Source