OpenAI veut démontrer qu’elle n’est pas en reste par rapport à ses concurrents avec le lancement de GPT-5.2 | Fortune

OpenAI veut démontrer qu’elle n’est pas en reste par rapport à ses concurrents avec le lancement de GPT-5.2 | Fortune

OpenAI, sous la pression concurrentielle croissante de Google et d’Anthropic, a dévoilé un nouveau modèle d’IA, GPT-5.2, qui, selon lui, surpasse de loin tous les modèles existants dans un large éventail de tâches.

Le nouveau modèle, qui est lancé moins d’un mois après qu’OpenAI a dévoilé son prédécesseur, GPT-5.1, s’est particulièrement bien comporté dans un test de référence de tâches professionnelles complexes dans une variété de « travaux de connaissances » (du droit à la comptabilité et à la finance), ainsi que dans des évaluations impliquant du codage et du raisonnement mathématique, selon les données publiées par OpenAI.

Fidji Simo, ancien PDG d’InstaCart et maintenant PDG des applications chez OpenAI, a déclaré aux journalistes que le modèle ne devrait pas être considéré comme une réponse directe au modèle Gemini 3 Pro AI de Google, lancé le mois dernier. Cette version a incité le PDG d’OpenAI, Sam Altman, à publier un « code rouge », retardant le lancement de plusieurs initiatives visant à concentrer davantage de personnel et de ressources informatiques sur l’amélioration de son produit principal, ChatGPT.

“Je dirais que (Code Red) aide à la sortie de ce modèle, mais ce n’est pas la raison pour laquelle il sort cette semaine en particulier, il est en préparation depuis un moment”, a-t-il déclaré.

Il a déclaré que l’entreprise construisait GPT-5.2 “depuis plusieurs mois”. “Nous n’avons pas pu changer ces modèles en une semaine seulement. C’est le résultat de beaucoup de travail”, a-t-il déclaré. Le modèle était connu en interne sous le nom de code « Garlic », selon un article publié dans The Information. La veille du lancement du modèle, Altman a annoncé son lancement imminent en publiant un clip vidéo sur les réseaux sociaux le montrant en train de préparer un plat avec beaucoup d’ail.

Les dirigeants d’OpenAI ont déclaré que le modèle était entre les mains de “clients Alpha” qui aidaient à tester ses performances pendant “plusieurs semaines”, une période qui signifierait que le modèle était terminé avant la déclaration “code rouge” d’Altman.

Ces testeurs comprenaient la startup d’IA juridique Harvey, l’application de prise de notes Notion et la société de logiciels de gestion de fichiers Box, ainsi que Shopify et Zoom.

OpenAI a déclaré que ces clients ont constaté que GPT-5.2 démontrait une capacité « de pointe » à utiliser d’autres outils logiciels pour effectuer des tâches, ainsi qu’à exceller dans l’écriture et le débogage de code.

Le codage est devenu l’un des cas d’utilisation les plus compétitifs pour la mise en œuvre de modèles d’IA au sein des entreprises. Bien qu’OpenAI ait eu une longueur d’avance dans ce domaine, le modèle Claude d’Anthropic s’est avéré particulièrement populaire auprès des entreprises, dépassant la part de marché d’OpenAI de plusieurs chiffres. OpenAI espère sans aucun doute convaincre les clients de revenir à leurs modèles pour encoder avec GPT-5.2.

Simo a déclaré que “Code Red” aidait OpenAI à se concentrer sur l’amélioration de ChatGPT. “Le Code Rouge est vraiment un signal à l’entreprise que nous voulons mettre en commun les ressources dans un domaine particulier, et c’est une façon de vraiment définir les priorités et de définir les choses qui peuvent être dépriorisées”, a-t-il déclaré. “Nous avons donc eu une augmentation des ressources axées sur ChatGPT en général.”

La société a également déclaré que son nouveau modèle est meilleur que les précédents pour fournir des « fins sûres », qu’elle définit comme donnant aux utilisateurs des réponses utiles sans dire des choses qui pourraient contribuer ou aggraver les crises de santé mentale.

“En matière de sécurité, comme le montrent les critères, nous nous améliorons dans pratiquement toutes les dimensions de la sécurité, qu’il s’agisse de l’automutilation, des différents types de santé mentale ou de dépendance émotionnelle”, a déclaré Simo. “Nous sommes très fiers du travail que nous faisons ici. C’est une priorité absolue pour nous et nous ne publions des modèles que lorsque nous sommes sûrs que les protocoles de sécurité ont été suivis et que nous sommes fiers de notre travail.”

Le lancement du nouveau modèle a eu lieu le jour même où une nouvelle action en justice a été déposée contre la société, alléguant que les interactions de ChatGPT avec un utilisateur souffrant de problèmes psychologiques avaient contribué à un meurtre-suicide dans le Connecticut. L’entreprise fait également face à d’autres poursuites alléguant que ChatGPT a contribué aux suicides de personnes. La société a qualifié le meurtre-suicide du Connecticut d'”incroyablement déchirant” et a déclaré qu’elle continue d’améliorer “la formation de ChatGPT pour reconnaître et répondre aux signes de détresse mentale ou émotionnelle, désamorcer les conversations et guider les gens vers un soutien réel”.

GPT-5.2 a montré une forte augmentation des performances dans plusieurs benchmarks intéressant les entreprises clientes. A atteint ou dépassé les performances humaines d’un expert sur un large éventail de tâches professionnelles difficiles, telles que mesurées par le benchmark GDPval d’OpenAI, 70,9 % du temps. Cela se compare à seulement 38,8 % du temps pour GPT-5, un modèle OpenAI publié en août ; 59,6% pour Claude Opus 4.5 d’Anthropic ; et 53,3% pour le Gemini 3 Pro de Google.

Sur le benchmark de développement logiciel, SWE-Bench Pro, GPT-5.2 a obtenu un score de 55,6 %, soit près de 5 points de pourcentage de mieux que son prédécesseur, GPT-5.1, et plus de 12 % de mieux que Gemini 3 Pro.

Aidan Clark, vice-président de la recherche (formation) chez OpenAI, a refusé de répondre aux questions sur les méthodes de formation exactes qui ont été utilisées pour améliorer les performances de GPT-5.2, bien qu’il ait déclaré que l’entreprise avait apporté des améliorations à tous les niveaux, y compris la pré-formation, l’étape initiale de la création d’un modèle d’IA.

Lorsque Google a lancé son modèle Gemini 3 Pro le mois dernier, ses chercheurs ont également déclaré que l’entreprise avait apporté des améliorations à la fois avant et après la formation. Cela a surpris certains acteurs du secteur qui pensaient que les entreprises d’IA avaient largement épuisé la capacité d’extraire des améliorations substantielles de la phase de pré-formation de la construction de modèles, et des spéculations ont été émises selon lesquelles OpenAI aurait pu être prise au dépourvu par les progrès de Google dans ce domaine.

Website |  + posts
spot_imgspot_img

Articles connexes

spot_imgspot_img

LAISSER UN COMMENTAIRE

S'il vous plaît entrez votre commentaire!
S'il vous plaît entrez votre nom ici