
L’analyse récente de HSBC sur le défi financier auquel est confrontée OpenAI montre à quel point l’ampleur de la réflexion de l’entreprise est énorme. Il revendique déjà des revenus de 20 milliards de dollars. Il a engagé 1,4 milliard de dollars pour construire les nouveaux centres de données qui alimenteront son interface ChatGPT. Et même si elle peut générer plus de 200 milliards de dollars de revenus d’ici 2030, elle aura encore besoin de 207 milliards de dollars de financement supplémentaires pour survivre.
Ce sont des sommes énormes.
Mais une douzaine d’experts en IA qui se sont récemment entretenus avec Fortune lors du Web Summit à Lisbonne ont décrit un avenir différent pour l’IA. Cet avenir, disent-ils, se caractérise par des opérations d’IA beaucoup plus petites qui tournent souvent autour d’« agents » d’IA qui effectuent des tâches spécialisées et de niche et n’ont donc pas besoin des grands modèles de langage gargantuesques qui sous-tendent OpenAI, Gemini de Google ou Claude d’Anthropic.
“Leur évaluation est basée sur le fait que plus c’est mieux, ce qui n’est pas nécessairement le cas”, a déclaré Babak Hodjat, responsable de l’intelligence artificielle chez Cognizant, à Fortune.
“Nous utilisons de grands modèles de langage. Nous n’avons pas besoin des plus grands. Il existe un seuil à partir duquel un grand modèle de langage est capable de suivre des instructions dans un domaine limité et est capable d’utiliser des outils et de communiquer avec d’autres agents”, a-t-il déclaré. “Si ce seuil est dépassé, cela suffit.”
Par exemple, lorsque DeepSeek a lancé un nouveau modèle en janvier dernier, cela a provoqué une liquidation des valeurs technologiques car son développement ne coûtait que quelques millions de dollars. Il fonctionnait également sur un modèle qui utilisait moins de paramètres par requête, beaucoup plus petit que ChatGPT d’OpenAI, mais dont les capacités étaient comparables, a déclaré Hodjat. Une fois en dessous d’une certaine taille, certains modèles n’ont pas besoin de centres de données ; Ils peuvent travailler sur un MacBook, a-t-il déclaré. “C’est la différence et c’est la tendance”, a-t-il déclaré.
Plusieurs entreprises orientent leurs services autour d’agents ou d’applications d’IA, en supposant que les utilisateurs voudront que des applications spécifiques fassent des choses spécifiques. Superhuman, anciennement Grammarly, gère une boutique d’applications remplie « d’agents IA qui peuvent s’installer dans le navigateur ou dans l’une des milliers d’applications que Grammarly a déjà l’autorisation d’exécuter », selon le PDG Shishir Mehrotra.
Chez Mozilla, la PDG Laura Chambers a une stratégie similaire pour le navigateur Firefox. “Nous avons certaines fonctionnalités d’IA, comme une fonctionnalité” secouer pour résumer “, un regroupement d’onglets intelligents mobiles, des aperçus de liens, des traductions qui utilisent l’IA. Ce que nous faisons avec elles, c’est que nous les exécutons toutes localement, afin que les données ne quittent jamais votre appareil. Elles ne sont pas partagées avec les modèles, elles ne sont pas partagées avec les LLM. Nous avons également un petit curseur où vous pouvez choisir votre propre modèle avec lequel vous souhaitez travailler et utiliser l’IA de cette façon”, a-t-il déclaré.
Chez le fabricant de puces ARM, le chef de la stratégie et directeur marketing, Ami Badani, a déclaré à Fortune que l’entreprise était indépendante du modèle. “Ce que nous faisons, c’est créer des extensions personnalisées au-dessus du LLM pour des cas d’utilisation très spécifiques. Parce que ces cas d’utilisation varient considérablement d’une entreprise à l’autre”, a-t-il déclaré.
Cette approche – des agents d’IA hautement ciblés fonctionnant comme des entreprises distinctes – contraste avec les plateformes d’IA massives à usage général. À l’avenir, une source a demandé à Fortune : utiliseriez-vous ChatGPT pour réserver une chambre d’hôtel qui correspond à vos besoins spécifiques (peut-être souhaitez-vous une chambre avec une baignoire au lieu d’une douche, ou une vue vers l’ouest ?) ou feriez-vous appel à un agent spécialisé qui dispose d’une base de données d’un kilomètre de profondeur qui ne contient que des données d’hôtel.
Cette approche attire des investissements importants. IBM Ventures, un fonds de capital-risque axé sur l’IA de 500 millions de dollars, a investi dans des efforts d’IA résolument peu glamour qui remplissent des niches commerciales obscures. L’un de ces investissements concerne une société appelée Not Diamond. Cette startup a observé que 85 % des entreprises utilisant l’IA utilisent plus d’un modèle d’IA. Certains modèles sont meilleurs que d’autres pour différentes tâches, donc choisir le bon modèle pour la bonne tâche peut devenir un choix stratégique important pour une entreprise. Not Diamond crée un « modèle-routeur » qui envoie automatiquement votre tâche au meilleur modèle.
“Vous avez besoin de quelqu’un pour vous aider à comprendre. Chez IBM, nous croyons en une stratégie de modèle adaptée, ce qui signifie que vous avez besoin du bon modèle pour la bonne charge de travail. Lorsque vous disposez d’un modèle de routeur qui peut vous aider à le faire, cela fait une grande différence”, a déclaré Emily Fontaine, responsable des risques chez IBM, à Fortune.



