Exclusif : Callosum, une startup qui cherche à briser la mainmise de Nvidia sur les charges de travail d’IA, lève 10,25 millions de dollars de nouveau financement | Fortune

Exclusif : Callosum, une startup qui cherche à briser la mainmise de Nvidia sur les charges de travail d’IA, lève 10,25 millions de dollars de nouveau financement | Fortune

Une startup basée à Londres, fondée par deux neuroscientifiques formés à Cambridge, a levé 10,25 millions de dollars pour sa startup Callosum, qui crée un logiciel qui orchestre les charges de travail d’IA sur un mélange de différents types de puces, remettant en question la dépendance de l’industrie à l’exécution de modèles de plus en plus grands sur des banques de GPU Nvidia identiques.

La société a également annoncé qu’elle recevrait un financement de recherche du gouvernement britannique, qui étudie les moyens de construire une infrastructure dite de « cloud souverain » pour l’IA qui serait indépendante, ou du moins pas exclusivement dépendante, des fournisseurs de technologie américains.

Les cofondateurs de Callosum, Danyal Akarca et Jascha Achterberg, qui se sont rencontrés lors de leur doctorat à Cambridge vers 2019, disposent d’un logiciel capable de répartir les tâches d’IA sur des puces de différents fabricants, qu’il s’agisse de GPU Nvidia, de processeurs AMD, de silicium Trainium et d’Inferentia personnalisé d’Amazon Web Services, ou de conceptions plus récentes de startups comme Cerebras et SambaNova, tirant ainsi des avantages en termes de performances de chacun.

Le cycle de financement a été mené par Plural, le fonds européen de capital-risque cofondé par Taavet Hinrikus de Wise et Ian Hogarth, qui a également été le premier président de l’AI Safety Institute du Royaume-Uni. Des investisseurs providentiels tels que Charlie Songhurst, Stan Boland de FiveAI et John Lazar de la Royal Academy of Engineering ont également participé. Par ailleurs, l’Agence de recherche et d’inventions avancées (ARIA) du gouvernement britannique accorde des subventions à l’entreprise pour accélérer la recherche et le développement en vue d’intégrer de nouvelles technologies de puces dans sa plate-forme, bien qu’ARIA ne soit pas elle-même un investisseur dans le cycle, a déclaré Akarca dans une interview avec Fortune.

La thèse de l’entreprise s’appuie sur les recherches universitaires des cofondateurs à l’intersection des neurosciences et de l’informatique : le cerveau humain n’obtient pas l’intelligence en copiant un type de neurone des milliards de fois, mais en combinant de nombreux types différents de cellules et de circuits spécialisés qui fonctionnent ensemble. Ils estiment que l’informatique IA devrait suivre le même principe.

“Les grands laboratoires parient actuellement qu’un seul modèle les gouvernera tous. Nous pensons que c’est faux et nos travaux le prouvent”, a déclaré Akarca. “La nature montre que la véritable intelligence naît de la collaboration de nombreux systèmes.”

Callosum entre sur un marché en profonde mutation structurelle. Après des années au cours desquelles les dépenses en IA étaient dominées par la formation de modèles de base massifs sur des racks de GPU Nvidia identiques, l’industrie se tourne désormais vers l’inférence : le processus d’exécution de modèles entraînés pour produire des résultats. Deloitte a estimé que les charges de travail d’inférence représenteront environ les deux tiers de l’ensemble des calculs d’IA en 2026, contre un tiers en 2023, et que le marché des puces optimisées pour l’inférence atteindra plus de 50 milliards de dollars cette année. Ce changement crée des opportunités pour un large éventail de fabricants de puces de contester la domination de Nvidia.

Callosum parie qu’il peut s’agir de la couche logicielle qui unit ce paysage matériel de plus en plus fragmenté. Sa plateforme fonctionne avec plusieurs fournisseurs de cloud, notamment AWS, Google Cloud et Microsoft Azure, et est conçue pour que les clients n’aient pas à reconcevoir leurs configurations cloud existantes pour l’utiliser. “Il s’agit d’un produit logiciel qui prend votre charge de travail d’IA et l’organise dans les différentes configurations multi-cloud que vous pouvez utiliser”, a déclaré Akarca.

Les cofondateurs affirment que l’approche produit de grands avantages dans les tâches complexes du monde réel qui impliquent de nombreux types de décisions différents, telles que l’automatisation de l’utilisation de l’ordinateur ou le traitement des flux de travail commerciaux. Pour des tâches comme celles-ci, Callosum affirme que son système peut offrir une précision deux fois supérieure, des performances sept fois plus rapides et un coût quatre fois inférieur par rapport à l’exécution des mêmes charges de travail sur un matériel identique.

Achterberg a expliqué que les gains de précision proviennent de la nature des problèmes résolus. “Des problèmes simples, des modèles individuels conviennent parfaitement”, a-t-il déclaré. Mais les tâches commerciales complexes sont une autre affaire. “L’automatisation de l’utilisation des ordinateurs, l’automatisation des paiements, par exemple, sont des problèmes sur lesquels nous nous concentrons. Ils sont intrinsèquement hétérogènes”, a déclaré Achterberg. “Il y a en fait de très nombreuses étapes à franchir pour résoudre le problème, et un seul modèle n’est pas toujours optimal.”

Différentes parties d’un flux de travail complexe peuvent nécessiter différentes choses : certaines étapes nécessitent des modèles très rapides et peu coûteux qui peuvent être rapidement itérés par essais et erreurs, tandis que d’autres nécessitent un raisonnement plus large et plus performant. En faisant correspondre chaque sous-tâche au bon modèle exécuté sur le bon matériel, Callosum affirme qu’il peut surmonter l’approche conventionnelle consistant à lancer un modèle puissant sur l’ensemble du problème.

Callosum cible deux types de clients : les entreprises qui construisent des systèmes d’IA multi-agents qui ont besoin de performances supérieures dans des flux de travail complexes, et les fabricants de puces émergents qui souhaitent démontrer les capacités de leur matériel à grande échelle. “Ce que nous voulons, c’est que toutes ces nouvelles technologies de puces, qui sont étonnantes, ont des performances étonnantes et des avantages étonnants, trouvent un moyen d’entrer sur le marché où nous pouvons réellement les réaliser”, a déclaré Achterberg.

L’entreprise travaille également avec des entreprises travaillant sur de nouvelles façons de connecter des racks de puces IA au sein des centres de données (appelées « interconnexion »), y compris celles développant des réseaux basés sur la photonique, une technologie qui transmet des données en utilisant la lumière au lieu d’impulsions électriques. Ces technologies sont conçues pour résoudre les goulots d’étranglement liés au mélange de données au sein d’un centre de données, un défi qui devient plus complexe à mesure que différents types de puces doivent communiquer entre elles.

Pour l’avenir, les cofondateurs déclarent qu’ils prévoient d’utiliser les fonds pour agrandir leur équipe basée à Londres, commencer à s’étendre aux États-Unis et commencer à construire leur propre infrastructure matérielle complémentaire. Son ambition à long terme va au-delà des logiciels et implique de repenser en profondeur la conception des centres de données.

“Tout le monde pensait que la diversité des puces était un inconvénient qui devait être géré. Nous avons vu le contraire, c’est-à-dire un avantage qui doit être exploité”, a déclaré Achterberg. “Nous n’optimisons pas un algorithme au-dessus de l’ensemble existant. Nous utilisons un logiciel pour contrôler tous les leviers du système, tirant ainsi les bénéfices de la diversité que d’autres rejettent.”

Ian Hogarth, associé chez Plural, a déclaré dans un communiqué : « La vision (de Callosum) d’un avenir multimodèle et multipuce pourrait être transformatrice et les positionner pour rivaliser avec les plus grands fabricants de puces et de modèles au monde. Ce sont des fondateurs sérieux qui s’attaquent à une mission sérieuse. »

Website |  + posts
spot_imgspot_img

Articles connexes

spot_imgspot_img

LAISSER UN COMMENTAIRE

S'il vous plaît entrez votre commentaire!
S'il vous plaît entrez votre nom ici