Exclusif : Anthropic a laissé les détails d’un modèle inédit, un prochain événement exclusif du PDG, dans une base de données publique | Fortune

Exclusif : Anthropic a laissé les détails d’un modèle inédit, un prochain événement exclusif du PDG, dans une base de données publique | Fortune

La société d’intelligence artificielle Anthropic a révélé par inadvertance les détails d’un prochain lancement de modèle, d’un événement exclusif du PDG et d’autres données internes, notamment des images et des PDF, dans ce qui semble être une faille de sécurité importante.

Les informations non encore publiques ont été rendues accessibles via le système de gestion de contenu (CMS) de l’entreprise, qu’Anthropic utilise pour publier des informations dans les sections du site Web de l’entreprise.

Avant de prendre ces mesures, Anthropic stockait tout le contenu de son site Web, tel que les articles de blog, les images et les documents, dans un système central accessible sans connexion. Toute personne possédant des connaissances techniques pouvait envoyer des requêtes à ce système public, lui demandant de renvoyer des informations sur les fichiers qu’il contient.

Même si une partie de ce contenu n’avait pas été publiée sur le site Web d’Anthropic, le système sous-jacent renverrait toujours les actifs numériques qu’il stockait à toute personne sachant comment le demander. Cela signifie que les documents non publiés, y compris les ébauches et les ressources internes, sont directement accessibles.

Le problème semble provenir du fonctionnement du système de gestion de contenu (CMS) utilisé par Anthropic. Tous les actifs (tels que les logos, les graphiques ou les articles de recherche) téléchargés vers l’entrepôt de données central étaient publics par défaut, à moins qu’ils ne soient explicitement définis comme privés. L’entreprise semble avoir oublié de restreindre l’accès à certains documents qui n’étaient pas censés être publics, ce qui a entraîné un grand nombre de fichiers disponibles dans le lac de données public de l’entreprise, ont déclaré à Fortune les professionnels de la cybersécurité qui ont analysé les données. Plusieurs actifs de l’entreprise disposaient également d’adresses de navigateur publiques.

“Un problème avec l’un de nos outils CMS externes a rendu le projet de contenu accessible”, a déclaré un porte-parole d’Anthropic à Fortune. Le porte-parole a attribué le problème à « une erreur humaine dans la configuration du CMS ».

Il y a eu récemment plusieurs cas très médiatisés d’entreprises technologiques confrontées à des problèmes techniques et à des problèmes dus à des problèmes avec le code généré par l’IA ou les agents d’IA. Mais Anthropic, qui fabrique les modèles populaires d’IA Claude et se vante d’automatiser une grande partie de son propre développement logiciel interne à l’aide d’agents de codage d’IA basés sur Claude, a déclaré que l’IA n’était pas à blâmer dans cette affaire.

Le problème avec son CMS “n’était pas lié à Claude, Cowork ou à tout autre outil d’IA d’Anthropic”, a déclaré le porte-parole d’Anthropic.

La société a également tenté de minimiser certains éléments qui n’avaient pas été protégés. “Ces documents étaient des ébauches initiales de contenu envisagé pour publication et n’impliquaient pas notre infrastructure de base, nos systèmes d’intelligence artificielle, nos données clients ou notre architecture de sécurité”, a déclaré le porte-parole.

Alors que de nombreux documents semblent être des éléments abandonnés ou inutilisés provenant d’articles de blog précédents, tels que des images, des bannières et des logos, certaines données semblent détailler des informations sensibles.

Les documents incluent des détails sur les annonces de produits à venir, y compris des informations sur un modèle d’IA inédit qui, selon Anthropic dans les documents, est le modèle le plus performant qu’il ait jamais formé.

Après avoir été contactée par Fortune, la société a reconnu qu’elle développait et testait avec des clients à accès anticipé un nouveau modèle qui, selon elle, représentait un « changement radical » dans les capacités de l’IA, avec des performances nettement meilleures en « raisonnement, codage et cybersécurité » que les modèles Anthropic précédents.

Les données accessibles au public comprenaient également des informations sur une prochaine retraite sur invitation uniquement pour les PDG de grandes entreprises européennes qui se tiendra au Royaume-Uni, à laquelle le PDG d’Anthropic, Dario Amodei, devrait participer. Un porte-parole d’Anthropic a déclaré que la retraite faisait « partie d’une série continue d’événements que nous avons organisés au cours de l’année écoulée » et que la société « développait un modèle à usage général avec des avancées significatives en matière de raisonnement, de codage et de cybersécurité ».

Parmi les documents figuraient également des images qui semblent être destinées à un usage interne, notamment une image avec une légende décrivant le « congé parental » d’un employé.

Ce n’est pas la première fois qu’une entreprise technologique expose par inadvertance des actifs internes ou de pré-lancement en les rendant accessibles au public avant les annonces officielles.

Apple a divulgué des informations à deux reprises via son propre site Web : une fois en 2018, lorsque les noms des prochains iPhone sont apparus dans un fichier de plan de site accessible au public quelques heures avant le lancement, et de nouveau fin 2025, lorsqu’un développeur a découvert qu’Apple avait livré son App Store repensé avec des fichiers de débogage actifs, rendant tout le code interne du site lisible par toute personne disposant d’un navigateur.

Des sociétés de jeux comme Epic Games et Nintendo ont également vu des images de pré-lancement, des ressources de jeu et d’autres médias divulgués via des systèmes de réseau de diffusion de contenu (CDN) ou des serveurs de préparation, similaires au lac de données Anthropic utilisé dans ce cas. Même des entreprises plus grandes comme Google ont accidentellement exposé leur documentation interne dans des URL publiques, et les données associées aux véhicules Tesla ont été exposées via des serveurs tiers mal configurés.

Cependant, le problème risque d’être exacerbé par les outils de codage d’IA désormais disponibles sur le marché, notamment Claude Code d’Anthropic.

Ces outils peuvent automatiser l’exploration, la détection de modèles et la corrélation des actifs accessibles au public, facilitant ainsi la découverte de ce type de contenu et réduisant les barrières à l’entrée pour ce faire. Les outils d’IA comme Claude Code ou Codex peuvent également générer des scripts ou des requêtes qui analysent des ensembles de données entiers, identifiant rapidement des modèles ou des conventions de dénomination de fichiers qu’un humain pourrait manquer.

Website |  + posts
spot_imgspot_img

Articles connexes

spot_imgspot_img

LAISSER UN COMMENTAIRE

S'il vous plaît entrez votre commentaire!
S'il vous plaît entrez votre nom ici