Meta présente Muse Spark, son premier nouveau modèle depuis ses débuts ratés avec Llama 4. Mais Muse Spark sera-t-elle à la hauteur des attentes ? | Fortune

Meta présente Muse Spark, son premier nouveau modèle depuis ses débuts ratés avec Llama 4. Mais Muse Spark sera-t-elle à la hauteur des attentes ? | Fortune

Meta a dévoilé Muse Spark, le premier modèle d’IA produit par ses Meta Superintelligence Labs, la nouvelle unité de recherche en IA qu’elle a créée l’année dernière et qui a dépensé des milliards de dollars en personnel et en équipement.

Le modèle est, selon les tests de référence publiés par Meta, compétitif avec les principaux modèles d’IA d’OpenAI, Anthropic et Google dans de nombreuses tâches, même s’il ne les surpasse pas dans tous les domaines. Pourtant, si les résultats du benchmark tiennent le coup lorsqu’ils sont testés par des experts indépendants, Muse Spark semble ramener Meta dans la course à l’IA après que son dernier modèle d’IA, Llama 4, lancé en avril 2025, ait été largement critiqué comme un échec.

Cependant, dans le passé, Meta a été surpris en train de manipuler les résultats de référence publiés d’un modèle d’IA pour le faire apparaître plus performant que ne l’était réellement la version disponible pour la plupart des utilisateurs. Ce fut le cas avec les benchmarks Llama 4 de Meta, où la société a admis plus tard avoir utilisé des versions spécialisées et inédites du modèle, adaptées à des tâches spécifiques, pour améliorer les scores de référence dans ces domaines, alors que la version générale disponible pour tous les utilisateurs ne fonctionnait pas aussi bien.

Et il y a un autre problème. Peu de personnes pourront utiliser le nouveau modèle Meta en dehors de l’écosystème de produits de l’entreprise. Contrairement aux modèles d’IA précédents de Meta, qui étaient publiés en tant que modèles « à poids ouvert », ce qui signifie que n’importe qui pouvait télécharger les modèles gratuitement et les exécuter sur son propre ordinateur, ainsi que les modifier et les régler à sa guise, Muse Spark est, du moins pour le moment, principalement un outil interne pour Meta.

Actuellement, le modèle alimente l’assistant Meta AI dans l’application autonome Meta AI de l’entreprise et dans meta.ai. La société a annoncé qu’elle le déploierait sur WhatsApp, Instagram, Facebook, Messenger et les lunettes Ray-Ban AI de Meta dans les semaines à venir. Il a également annoncé qu’il proposerait le modèle dans un « aperçu privé » à des partenaires sélectionnés via une interface de programmation d’application (API). Cela rend Muse Spark encore plus propriétaire que les modèles propriétaires payants proposés par les concurrents de Meta. (Meta a déclaré dans un article de blog qu’elle espérait rendre les futures versions open source du modèle.)

Muse Spark est le premier modèle de raisonnement de Meta, ce qui signifie que vous pouvez travailler étape par étape, en utilisant différentes stratégies si votre approche initiale ne fonctionne pas. Tous les modèles précédents de l’entreprise ont été conçus pour produire une réponse instantanée basée sur la formation du modèle. Muse Spark est également un modèle multimodal capable de recevoir et de générer du texte et des images. Le modèle prend également en charge l’utilisation d’autres outils logiciels et peut aider à orchestrer le travail de plusieurs sous-agents, selon un article de blog technique publié par Meta.

Dans son article de blog annonçant le nouveau modèle, Meta décrit Muse Spark comme « petit et rapide de par sa conception, mais suffisamment capable de raisonner sur des questions complexes en sciences, mathématiques et santé ». Il décrit le modèle comme le premier d’une série de nouveaux modèles, dans lesquels Muse Spark est utilisé pour valider l’architecture et le régime de formation utilisé par Meta, avant que la société ne l’étende à des modèles plus grands et encore plus puissants de la même famille.

Le modèle dispose également d’un mode « contemplation » ou « réflexion » dans lequel vous pouvez demander aux sous-agents de raisonner en parallèle sur différentes parties d’une tâche. Meta a déclaré dans un blog technique publié sur le nouveau modèle que ce mode permet à Muse Spark de “rivaliser avec les modes de raisonnement extrêmes de modèles de pointe comme Gemini Deep Think et GPT Pro”.

Les résultats de référence publiés parallèlement au lancement dressent le portrait d’un modèle compétitif mais non dominant. Par exemple, sur le benchmark GPQA Diamond, qui est censé tester la capacité de raisonnement de niveau doctorat, Muse Spark a obtenu un score de 89,5 %, légèrement derrière les 94,3 % de Gemini 3.1 Pro, ainsi que les 92,7 % et 92,8 % obtenus respectivement par Claude Opus 4.6 d’Anthropic et GPT-5.4 d’OpenAI. Sur un benchmark de référence en matière de santé, HealthBench Hard, Muse Spark a surpassé tous les modèles concurrents avec un score de 42,8 %, ce qui était bien meilleur que l’Opus 4.6 ou le Gemini 3.1 Pro, et légèrement meilleur que le GPT-5.4.

Meta a reconnu les écarts de performances. Son article de blog technique indique que la société continue « d’investir dans des domaines présentant actuellement des écarts de performances, en particulier les systèmes d’agents à long terme et les flux de travail de codage ».

Le lancement de Muse Spark est le produit le plus tangible de la vaste réorganisation entreprise par Meta après le fiasco de Llama 4. En juin 2025, Meta a dépensé 14,3 milliards de dollars pour acquérir une participation sans droit de vote de 49 % dans Scale AI et a embauché son co-fondateur et PDG, Alexandr Wang, en tant que premier directeur de l’IA de Meta.

Wang a été chargé de diriger une unité Meta Superintelligence Labs nouvellement créée. Wang et Zuckerberg se sont lancés dans une frénésie d’acquisition de talents, offrant aux chercheurs en IA des laboratoires d’IA rivaux des rémunérations qui s’élèveraient, semble-t-il, à des centaines de millions de dollars, lorsque les capitaux propres étaient inclus. La société a également engagé des centaines de milliards de dollars pour construire une infrastructure informatique d’IA afin de soutenir sa nouvelle poussée en matière d’IA.

Depuis lors, de nouvelles réorganisations ont eu lieu, même lorsque Muse Spark était en développement. En mars 2026, Meta a créé une nouvelle organisation d’ingénierie en IA appliquée dirigée par Maher Saba, un vice-président qui travaillait auparavant dans l’unité de réalité virtuelle et augmentée de Meta, Reality Labs. Saba relève directement du CTO de Meta, Andrew Bosworth. L’unité de Saba travaille aux côtés de Wang Superintelligence Labs pour créer ce qu’un mémo interne décrit comme « le moteur de données qui aide nos modèles à s’améliorer et à s’accélérer ». Cette décision a été largement interprétée comme un moyen pour Zuckerberg de couvrir ses paris, garantissant que le développement de l’IA axé sur les produits se poursuive même si Wang poursuit des recherches à plus long terme sur la superintelligence.

Dans un article de blog technique, Meta déclare qu’au cours des neuf derniers mois, son équipe a reconstruit sa pile d’IA à partir de zéro, y compris des améliorations de l’architecture des modèles, de l’optimisation et de la conservation des données. La société affirme que ces avancées lui permettent d’atteindre les mêmes capacités avec « plus d’un ordre de grandeur de calcul en moins » que le Llama 4 Maverick, le modèle précédent de Meta. Meta affirme également que son pipeline d’apprentissage par renforcement offre désormais des « gains transparents et prévisibles » et que Muse Spark est la première étape d’une « échelle d’évolution » délibérée dans laquelle chaque génération valide la précédente avant que l’entreprise ne forme des modèles plus grands.

En ce qui concerne la sécurité, Meta indique que Muse Spark a fait l’objet d’une évaluation approfondie avant son déploiement, conformément au cadre de sécurité mis à jour de l’entreprise. Le modèle rapporte des résultats de sécurité impressionnants concernant l’ingénierie d’armes biologiques potentielles : dans un benchmark, il a rejeté 98 % des demandes qui, selon les concepteurs du benchmark, pourraient aider quelqu’un à développer une arme biologique.

Cependant, le billet de blog indique également que le testeur tiers Apollo Research a découvert que Muse Spark démontrait le taux de « conscience de l’évaluation » le plus élevé de tous les modèles qu’Apollo ait jamais observés, identifiant fréquemment les scénarios de test comme des « pièges d’alignement ». Meta affirme que ses propres recherches de suivi ont trouvé des preuves initiales selon lesquelles cette prise de conscience peut affecter le comportement du modèle dans un petit sous-ensemble d’évaluations d’alignement, mais ont conclu qu ‘”il ne s’agissait pas d’un problème de blocage de la version”.

En 2001, Fortune a réuni pour la première fois « Les personnes les plus intelligentes que nous connaissons », réunissant des PDG et des fondateurs, des bâtisseurs et des investisseurs, des penseurs et des entrepreneurs. Depuis lors, Fortune Brainstorm Tech est le lieu où se rencontrent des idées audacieuses. Du 8 au 10 juin, nous retournerons à Aspen, là où tout a commencé, pour commémorer les 25 ans de Brainstorm. Inscrivez-vous maintenant.

Website |  + posts
spot_imgspot_img

Articles connexes

spot_imgspot_img

LAISSER UN COMMENTAIRE

S'il vous plaît entrez votre commentaire!
S'il vous plaît entrez votre nom ici