OpenAI lance Flex, IA lente et abordable

OpenAI lance Flex, IA lente et abordable

Crédits image : Bryce Durbin / TechCrunch

Pour renforcer sa compétitivité face à d’autres entreprises d’IA comme Google, OpenAI a lancé le traitement Flex, une option d’API qui réduit le coût d’utilisation des modèles d’IA en offrant des temps de réponse plus lents et des périodes occasionnelles d’« indisponibilité des ressources ».

Le traitement Flex, actuellement en version bêta pour les nouveaux modèles de raisonnement o3 et o4-mini d’OpenAI, est destiné aux tâches de moindre priorité telles que les évaluations de modèles, l’enrichissement de données et les charges de travail asynchrones, selon OpenAI.

Réduction significative des coûts d’utilisation de l’API

Cette option réduit les coûts d’API de 50 %. Pour le modèle o3, le traitement Flex facture 5 $ par million de jetons d’entrée (environ 750 000 mots) et 20 $ par million de jetons de sortie, contre 10 $ et 40 $ respectivement aux tarifs standards. Pour le modèle o4-mini, le coût descend à 0,55 $ par million de jetons d’entrée et 2,20 $ par million de jetons de sortie, contre 1,10 $ et 4,40 $ auparavant.

Le lancement du traitement Flex intervient alors que les prix des modèles d’IA de pointe continuent d’augmenter, tandis que des concurrents proposent des modèles plus abordables et efficaces, pensés pour les utilisateurs soucieux de leur budget. Récemment, Google a présenté Gemini 2.5 Flash, un modèle de raisonnement qui égale ou dépasse les performances du R1 de DeepSeek à un coût inférieur par jeton d’entrée.

Dans un courriel récent adressé à ses clients, OpenAI a informé que les développeurs des trois premiers niveaux de son système d’usage doivent désormais effectuer une vérification d’identité pour accéder au modèle o3. Ces niveaux sont déterminés en fonction des dépenses des utilisateurs sur les services d’OpenAI. L’accès aux résumés de raisonnement et à l’API en streaming de o3 exige également cette vérification.

OpenAI a auparavant expliqué que ce processus de vérification d’identité vise à prévenir les abus et à garantir le respect de ses politiques d’utilisation.


Lire l’article original sur :  Techcrunch

Lire plus :  A Developer Created an Experiment to Observe How AI Chatbots Handle Sensitive or Controversial Issues

Partager cette publication

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *