
Le responsable de l’infrastructure IA de Google a averti que l’entreprise devait développer sa technologie pour répondre à un afflux massif d’utilisateurs et aux demandes complexes traitées par les produits IA, ce qui pourrait être le signe que les craintes d’une bulle sont exagérées.
Amin Vahdat, vice-président qui dirige l’équipe mondiale d’infrastructure et d’intelligence artificielle de Google, a déclaré lors d’une présentation lors d’une réunion générale le 6 novembre que l’entreprise devait doubler sa capacité de service tous les six mois, avec « les 1 000 prochaines fois dans 4 à 5 ans », a rapporté CNBC.
Cela fait référence à la capacité de Google à garantir que Gemini et d’autres produits d’IA qui s’appuient sur Google Cloud peuvent toujours fonctionner correctement lorsqu’ils sont consultés par un nombre croissant d’utilisateurs. Ceci est différent de l’infrastructure informatique ou physique impliquée dans la formation de l’IA.
Un porte-parole de Google a déclaré à Fortune que « la demande de services d’IA signifie qu’on nous demande de fournir beaucoup plus de puissance de calcul, ce que nous optimisons grâce à l’efficacité du matériel, des logiciels et des optimisations de modèles, ainsi qu’à de nouveaux investissements », citant les puces Ironwood de la société comme exemple de la façon dont son propre matériel entraîne des améliorations de la puissance de calcul.
Au cours des années précédentes, tous les hyperscalers (pensez à Google Cloud, mais aussi Amazon et Microsoft Azure) se sont précipités pour développer l’informatique en prévision d’un afflux d’utilisateurs d’IA.
Désormais, les utilisateurs sont là, a déclaré Shay Boloor, stratège en chef du marché chez Futurum Equities. Mais à mesure que chaque entreprise développe son offre d’IA, la facilité d’entretien apparaît comme le prochain grand défi à relever.
“Nous entrons dans la deuxième étape de l’IA, où la facilité d’entretien compte encore plus que la capacité de calcul, car l’informatique crée le modèle, mais la facilité d’entretien détermine dans quelle mesure et à quelle vitesse ce modèle peut réellement atteindre les utilisateurs”, a-t-il déclaré à Fortune.
Google, avec ses énormes dépenses en capital et ses décisions stratégiques passées visant à développer ses propres puces d’intelligence artificielle, sera probablement en mesure de doubler sa capacité de service tous les six mois, a déclaré Boloor.
Cependant, Google et ses concurrents sont toujours confrontés à une bataille difficile, a-t-il ajouté, d’autant plus que les produits d’IA commencent à traiter des requêtes plus complexes, notamment les requêtes de recherche avancées et les vidéos.
“Le goulot d’étranglement n’est pas l’ambition, mais plutôt les limitations physiques, telles que l’alimentation, le refroidissement, la bande passante du réseau et le temps nécessaire pour construire ces capacités de centre de données alimentées”, a-t-il déclaré.
Cependant, le fait que Google soit apparemment confronté à une telle demande pour son infrastructure d’IA qu’il s’efforce de doubler si rapidement sa capacité de service pourrait être le signe que les sombres prédictions faites par les pessimistes de l’IA ne sont pas entièrement exactes, a déclaré Boloor.
Ces inquiétudes ont fait chuter les trois principaux indices boursiers de 1,9 % ou plus la semaine dernière, y compris le Nasdaq, à forte composante technologique.
“Il ne s’agit pas d’un enthousiasme spéculatif, mais simplement d’une demande refoulée et non satisfaite”, a-t-il déclaré. “Si les choses ralentissent un peu plus que ce que beaucoup de gens pensent, c’est parce que tout le monde est limité en informatique et en capacité de service accrue.”



