Google vient de donner à Wall Street une raison de repenser le plus grand trading d’IA disponible.
Google Research d’Alphabet a annoncé début mars avoir développé une nouvelle famille d’algorithmes de compression, TurboQuant, PolarQuant et Quantized Johnson-Lindenstrauss, ou QJL.
A quoi ça sert tout ça ? Son objectif est de réduire la mémoire nécessaire pour exécuter de grands modèles de langage et des systèmes de recherche vectorielle.
Lors des tests Google, TurboQuant a réduit d’au moins six fois les besoins en cache clé-valeur tout en préservant la précision, soulevant des questions importantes sur le plus gros problème pour les investisseurs. Qu’arrivera-t-il à la demande de mémoire et de stockage si les modèles d’IA s’améliorent considérablement ?
Cette question a rapidement touché une corde sensible. Micron Technology (MU), Western Digital (WDC), Seagate Technology (STX) et SanDisk (SNDK) ont chuté alors que les investisseurs ont compris la possibilité que les charges de travail d’IA n’aient peut-être pas besoin d’autant de puissance de feu.
La couverture du marché a directement lié cette baisse au grand rallye de Google, survenu à un moment où les actions d’infrastructures d’IA avaient déjà connu une forte hausse, convaincues que des modèles plus grands se traduisent par plus de mémoire, plus de stockage et plus de dépenses en capital.
C’est ce qui a rendu la réaction si alarmante. Wall Street ne se contentait pas de répondre à un blog de recherche. Cela répondait à l’idée qu’une partie de la valeur du boom de l’IA pourrait s’éloigner des fournisseurs de matériel. Où ira-t-il ensuite ? Eh bien, les entreprises chercheront probablement des moyens d’obtenir plus de performances avec la même base d’infrastructure.
Pour un commerce basé sur la rareté, c’est quelque peu alarmant.
“À mesure que l’IA s’intègre de plus en plus dans tout, du LLM à la recherche sémantique, ce travail sur la quantification vectorielle fondamentale sera plus critique que jamais”, ont écrit Amir Zandieh, chercheur chez Google, et Vahab Mirrokni, chercheur chez Google, dans un article de blog de l’entreprise.
TurboQuant de Google arrive dans le commerce de la mémoire IA
Google a présenté TurboQuant comme une solution à l’un des goulots d’étranglement les plus douloureux de l’IA moderne : la surcharge de mémoire.
À mesure que les modèles traitent des invites plus longues et des fenêtres de contexte plus grandes, le besoin de mémoire pour stocker les caches clé-valeur augmente, ce qui peut ralentir l’inférence et augmenter les dépenses opérationnelles.
La quantification vectorielle traditionnelle peut réduire cette empreinte, mais entraîne souvent des coûts supplémentaires car les systèmes doivent toujours stocker les constantes de quantification avec une grande précision.
En relation: Le PDG de Nvidia fait une annonce explosive sur la prochaine grande percée de l’IA
Google a déclaré que TurboQuant corrige cette faiblesse en combinant PolarQuant pour le travail de compression primaire avec QJL pour une correction d’erreurs à faible coût.
Cette distinction technique est la raison pour laquelle le marché réagit autant. Au cours des deux dernières années, les investisseurs ont récompensé l’idée selon laquelle l’intelligence artificielle continuera de forcer les hyperscalers et les constructeurs de modèles à acheter davantage de systèmes riches en mémoire, une plus grande capacité de stockage et davantage d’infrastructures de support.
Le travail de Google n’élimine pas cette thèse. Cependant, il brouille les pistes en montrant que l’innovation logicielle peut infléchir la courbe de la demande en matériel.
Lorsqu’un secteur est évalué en fonction de son intensité constante, la moindre allusion à une efficacité future entraînera une révision substantielle des prix.
Il existe encore un contre-argument important. TurboQuant reste une technologie au stade de la recherche, et Google annonce son intention de présenter des articles à l’ICLR 2026, tandis que PolarQuant est prévu pour l’AISTATS 2026.
Cela signifie que la liquidation peut avoir été provoquée à la fois par des personnes quittant des positions bondées et en prenant des bénéfices, ainsi que par un changement soudain de la demande sur le marché final. Et les haussiers ont encore des arguments à faire valoir : des informations récentes ont montré que les dépenses en infrastructures hyperscaling seront encore énormes en 2026.
Sandisk a ajouté une autre tournure à l’histoire, car cela s’est produit le jour même où les gens ont découvert un grand mouvement stratégique dans la mémoire.
Nanya Technology a déclaré le 25 mars que Sandisk Technologies, une filiale en propriété exclusive de Sandisk Corp., avait souscrit 138,685 millions d’actions ordinaires dans le cadre du placement privé de Nanya au prix de 223,9 NT$ par action.
Nanya a déclaré que les bénéfices seraient utilisés pour des installations d’usine et des équipements de production destinés à la fabrication de mémoire avancée afin de répondre à la demande informatique basée sur l’IA.
Sandisk a été le plus gros investisseur dans la levée de fonds d’environ 2,5 milliards de dollars et a également signé un accord de fourniture de DRAM à long terme avec Nanya, selon les rapports.
Cela crée l’écran partagé le plus intéressant jamais créé. D’une part, de nouveaux documents de Google suggèrent que les futurs modèles d’IA pourraient nécessiter moins de mémoire par charge de travail.
D’un autre côté, Sandisk continue de dépenser de l’argent réel pour garantir l’approvisionnement en mémoire nécessaire à la croissance à long terme de l’IA. Ce n’est pas quelque chose que les investisseurs peuvent ignorer. Le véritable débat en ce moment est de savoir ce qui se passera ensuite dans le commerce des infrastructures d’IA.
La question la plus profonde est de savoir si l’IA reste avant tout un problème matériel ou si elle devient un problème d’optimisation. Jusqu’à présent, le marché récompense massivement les bénéficiaires de matériel, des fabricants de mémoire aux fournisseurs de réseaux et aux partenaires GPU.
Mais Google nous rappelle que les gains les plus importants dans l’économie de l’IA peuvent provenir d’une compression plus intelligente, d’un meilleur routage, d’une inférence à moindre coût et d’une gestion plus efficace des données. Cela ne met pas fin à la construction ; il redistribue simplement une partie du pool de bénéfices.
C’est pourquoi ces actions ont suscité une réaction si violente. Les investisseurs ne se contentaient pas d’acheter et de vendre des informations sur un algorithme. Ils pariaient que les logiciels pourraient commencer à évoluer plus rapidement que les hypothèses du marché concernant le matériel. Si cela se produit, les gagnants de l’IA peuvent encore gagner gros. Mais l’essentiel est qu’ils ne gagneront pas de la même manière.

Google déclenche une nouvelle vente de stocks de mémoire IA
Photo de LUDOVIC MARIN sur Getty Images
Sandisk et Micron sont désormais confrontés à un récit plus difficile en matière d’IA
Pour l’instant, la lecture la plus claire n’est pas que Google a brisé et détruit le marché de la mémoire. C’est juste que Google a perturbé la simplicité du commerce de la mémoire.
Plus de valeurs technologiques :
Morgan Stanley fixe un objectif de prix époustouflant pour Micron après l’événement. Le problème des puces chinoises de Nvidia n’est pas ce que la plupart des investisseurs pensent.
Micron, Western Digital, Seagate et Sandisk bénéficient d’un récit simple.
Related: Le PDG de Micron lâche une bombe après que les énormes bénéfices de Micron ont dépassé
Des modèles plus grands, une inférence plus intense et un trafic d’IA plus important devraient nécessiter plus de puces, plus de stockage et plus de dépenses sur l’ensemble de la pile du centre de données. Ne vous méprenez pas, ce récit a encore du chemin à parcourir.
Des résultats récents de Micron ont montré que la demande en IA reste très élevée, et des informations récentes indiquent que les grands hyperscalers prévoient toujours de dépenser beaucoup d’argent en infrastructures en 2026.
Le fait est que la demande ne disparaît pas. L’essentiel est que les investisseurs réfléchissent soigneusement à la part de cette demande qui sera compensée par les gains d’efficacité du côté du modèle.
C’est alors que le calcul de la valeur devient plus difficile. Si l’IA continue de devenir plus intelligente mais que la quantité de mémoire nécessaire pour chaque tâche diminue, les fabricants de matériel informatique pourraient encore enregistrer de fortes ventes, mais pas le type de croissance régulière que les investisseurs espéraient.
Cette possibilité est particulièrement importante pour les actions qui sont déjà en forte hausse, car lorsque le marché voit une nouvelle raison de remettre en question la pente de la demande future, les grands gagnants sont généralement les premiers à être touchés. C’est précisément ce que fait le message de Google du 24 mars.
Points clés à retenir sur Google, Micron et SandiskGoogle Research a présenté TurboQuant, PolarQuant et QJL le 24 mars pour réduire la surcharge de mémoire de l’IA. Google a déclaré que TurboQuant avait réduit d’au moins six fois les besoins en cache clé-valeur lors de ses tests sans sacrifier la précision. Les stocks de mémoire et de stockage, notamment Micron, Western Digital, Seagate et Sandisk, ont été liquidés alors que les investisseurs ont réévalué les hypothèses de demande de matériel d’IA. Sandisk a accepté d’investir séparément dans Nanya et de garantir l’approvisionnement en DRAM, signe d’une confiance continue dans la demande de mémoire à long terme. La grande question pour le marché est de savoir si les prochains gains de l’IA iront davantage aux fournisseurs de matériel ou aux éditeurs de logiciels et aux modèles qui rendent l’infrastructure plus efficace.
L’échange de mémoire IA n’est pas mort. Je vous en prie. Mais ce n’est plus aussi simple que « plus de modèles, plus de puces ».
Google vient de rappeler à Wall Street que les logiciels peuvent aussi changer les choses.
Cela rend les choses difficiles pour Micron, Sandisk et le reste du groupe. Ils doivent désormais démontrer que la croissance de la demande peut compenser les gains d’efficacité du côté des modèles de l’entreprise. Cela signifie que pour les investisseurs, les trimestres à venir seront moins axés sur le battage médiatique que sur les tests.
En relation: Palantir vient d’accéder à quelque chose de très sensible



