Après l’accord Groq de Nvidia, ce sont les startups de puces IA qui se portent bien – et l’une d’elles vise à révolutionner | Fortune

Après l’accord Groq de Nvidia, ce sont les startups de puces IA qui se portent bien – et l’une d’elles vise à révolutionner | Fortune

Nvidia a publié une annonce surprise la veille de Noël : un accord de 20 milliards de dollars pour acquérir sous licence la technologie de la startup de puces IA Groq et recruter la plupart de son équipe, y compris le co-fondateur et PDG Jonathan Ross. C’est une décision qui laisse entendre que Nvidia ne suppose plus que ses GPU seront les seules puces utiles pour la prochaine grande phase de déploiement de l’IA : exécuter des modèles d’IA déjà formés pour tout faire, de la réponse aux requêtes et la génération de code à l’analyse d’une image (un processus connu sous le nom d’inférence), et ce à grande échelle.

L’accord avec Groq renforce la position d’autres startups construisant leurs propres puces d’IA, notamment Cerebras, D-Matrix et SambaNova (pour lesquelles Intel aurait signé une feuille de conditions pour l’acquérir), ainsi que de nouveaux acteurs comme la startup de puces basée au Royaume-Uni Fractile. Cela stimule également les startups de plateformes logicielles d’inférence d’IA comme Etched, Fireworks et Baseten, renforçant leurs valorisations et en faisant des cibles d’acquisition plus attractives en 2026, selon les analystes, fondateurs et investisseurs.

Karl Freund, fondateur et analyste principal de Cambrian-AI Research, a souligné D-Matrix, soutenu par Microsoft, qui a levé 275 millions de dollars le mois dernier pour une valorisation de 2 milliards de dollars. Comme Groq, D-Matrix se concentre sur l’échange d’une partie de la flexibilité des GPU Nvidia pour une plus grande vitesse et efficacité lors de l’exécution de modèles d’IA. “Je suis sûr que D-Matrix est actuellement une startup plutôt heureuse”, a déclaré Freund. “Je soupçonne que leur prochain tour aura une valorisation beaucoup plus élevée.”

Cerebras, une autre société de puces axée sur l’inférence, semble également bien positionnée. Cerebras, connu pour sa puce « à l’échelle d’une plaquette » conçue pour exécuter des modèles extrêmement grands sur une seule pièce de silicium, a déposé une demande d’introduction en bourse (IPO) après un délai antérieur. Freund a déclaré que la société est également de plus en plus considérée comme une cible potentielle d’acquisition. “Vous ne voulez pas attendre après l’introduction en bourse, quand cela coûtera plus cher”, a-t-il déclaré. “De ce point de vue, Cerebras se porte bien en ce moment.”

L’accord Nvidia-Groq a clarifié l’orientation du marché

Les dirigeants de ces sociétés affirment que la décision de Nvidia a contribué à clarifier l’orientation du marché. “Lorsque (l’accord Nvidia-Groq) a eu lieu, nous avons dit : ‘Enfin, le marché le reconnaît'”, a déclaré Sid Sheth, PDG de D-Matrix, à Fortune. “Je pense que ce que Nvidia a réellement fait, c’est de dire : ok, cette approche est une approche gagnante.”

Et le PDG de Cerebras, Andrew Feldman, a posté sur Mais ce fossé n’existe plus avec l’accord Groq, a écrit Feldman. “Cela reflète une réalité croissante du secteur : le marché de l’inférence se fragmente et une nouvelle catégorie est apparue dans laquelle la vitesse n’est pas une caractéristique : elle constitue la proposition de valeur dans son ensemble. Une proposition de valeur qui ne peut être réalisée que grâce à une architecture de puce différente de celle du GPU.”

Pourtant, tout le monde n’est pas convaincu que toutes les startups de puces d’inférence en bénéficieront de la même manière. Matt Murphy, associé chez Menlo Ventures, a déclaré que le secteur des puces reste difficile pour les investisseurs en capital-risque, compte tenu des exigences élevées en capitaux et des longs délais. “De nombreux investisseurs en capital-risque ont arrêté d’investir dans les puces il y a 10 ou 15 ans”, a déclaré Murphy. “C’est une activité à forte intensité de capital ; sortir un produit prend des années ; et les résultats sont difficiles à prédire.”

Cela dit, il a souligné Fireworks, une plate-forme d’inférence d’IA qui a levé 250 millions de dollars pour une valorisation de 4 milliards de dollars en octobre, comme une startup dotée d’un avantage technique, grâce à une équipe fondatrice composée d’ingénieurs qui ont construit PyTorch. Mais il a ajouté qu’il n’est pas encore clair dans quelle mesure l’enthousiasme actuel reflète une véritable différenciation technique. “Il est difficile de dire qui a vraiment quelque chose d’important par rapport à la marée qui (soulève) tous les bateaux, ce qui semble se produire”, a-t-il déclaré, ajoutant que la consolidation du secteur semblait désormais de plus en plus probable.

Le nouvel entrant cherche une véritable rupture

Mais au moins un vétéran du monde du matériel d’IA soutient que même les startups actuelles axées sur l’inférence ne sont pas vraiment perturbatrices.

Naveen Rao, ancien vice-président directeur de l’IA chez Databricks et fondateur de MosaicML, a récemment quitté Databricks pour lancer Unconventional AI, qui a confirmé le mois dernier un énorme tour de table de 475 millions de dollars dirigé par Andreessen Horowitz et Lightspeed Ventures. Leur avis : Des sociétés comme Groq, D-Matrix et Cerebras sont peut-être bien positionnées sur le marché actuel, mais elles continuent d’optimiser dans le même paradigme informatique numérique.

Après que l’accord Groq de Nvidia ait validé la demande d’inférences plus rapides et plus efficaces, les startups qui s’intègrent parfaitement dans la pile d’IA actuelle semblent soudainement beaucoup plus précieuses – non pas parce qu’elles ont réinventé l’informatique, affirme Rao, mais parce qu’elles y travaillent. L’IA non conventionnelle suit une voie plus radicale : construire un nouveau matériel qui tire parti du comportement physique du silicium lui-même et repenser les réseaux neuronaux pour s’adapter.

“Nous construisons la même machine fondamentale depuis 80 ans, une machine à chiffres numérique”, a-t-il déclaré. “Mais aucune charge de travail n’a jamais dominé plus de 2 % de tous les cycles de calcul.” Cela est en train de changer, explique-t-il : dans quelques années, 95 % de l’informatique sera utilisée pour l’IA.

De ce point de vue, il est important de construire une machine complètement différente de celle construite aujourd’hui, a-t-il déclaré. Cependant, Rao affirme que cet effort pourrait prendre cinq ans ou plus pour porter ses fruits et ne vise pas à tirer parti du boom actuel de l’inférence.

Website |  + posts
spot_imgspot_img

Articles connexes

spot_imgspot_img

LAISSER UN COMMENTAIRE

S'il vous plaît entrez votre commentaire!
S'il vous plaît entrez votre nom ici