Présentation de davantage de fonctionnalités de niveau entreprise pour les clients API
Présentation de davantage de fonctionnalités de niveau entreprise pour les clients API

Pour aider les organisations à faire évoluer leur utilisation de l'IA sans trop étendre leurs budgets, nous avons ajouté deux nouvelles façons de réduire les coûts sur les charges de travail cohérentes et asynchrones :

  • Utilisation réduite sur le débit engagé : Les clients ayant un niveau soutenu d'utilisation de jetons par minute (TPM) sur GPT-4 ou GPT-4 Turbo peuvent demander l'accès au débit provisionné pour bénéficier de remises allant de 10 à 50 % en fonction de la taille de l'engagement.
  • Coûts réduits sur les charges de travail asynchrones : Les clients peuvent utiliser notre nouveau API par lots pour exécuter des charges de travail non urgentes de manière asynchrone. Les requêtes API par lots sont facturées 50 % sur les prix partagés, offrent des limites de débit beaucoup plus élevées et renvoient les résultats dans les 24 heures. Ceci est idéal pour les cas d’utilisation tels que l’évaluation de modèles, la classification hors ligne, la synthèse et la génération de données synthétiques.


Nous prévoyons de continuer à ajouter de nouvelles fonctionnalités axées sur la sécurité de niveau entreprise, les contrôles administratifs et la gestion des coûts. Pour plus d'informations sur ces lancements, visitez notre Documentation API ou contactez notre équipe pour discuter de solutions personnalisées pour votre entreprise.




Source

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Scroll to Top