Mythos preview ramène l'industrie à la défense : la stabilité de la sécurité DeFi vacille, les ressources en IA affluent vers la piste de gestion des risques

robot
Création du résumé en cours

Mythos pousse l’industrie de l’IA vers la défense : plusieurs questions clés émergent

Le tweet de Deedy Das ne suscite pas seulement des discussions : il remet toute l’industrie du « niveau de performance du modèle » à « ce que les modèles performants peuvent faire, et comment les encadrer ». D’après les informations publiques, Mythos Preview a obtenu 99/100 sur BenchLM, la tâche d’agent avec un score parfait, et environ 94 % sur le benchmark de codage SWE-bench, nettement supérieur à Claude Opus 4.6. Selon les rapports, ce modèle, avec moins de 50 dollars de puissance de calcul, a permis d’identifier une faille OpenBSD datant de 27 ans, et il peut aussi enchaîner lui-même des chaînes de vulnérabilités du noyau Linux. Karpathy et LeCun n’ont pas encore fait de déclaration publique : c’est peut-être parce que le modèle n’est pas encore ouvert aux chercheurs indépendants.

Mon jugement : l’attention de l’industrie passe de « gravir le classement des capacités » à « la défense et la maîtrise ». Anthropic, via Project Glasswing, met en place un accès limité, afin de traiter d’abord les problèmes d’usage à double destination.

  • L’accès des entreprises crée un fossé de ressources et d’informations : Glasswing a déjà fait entrer plus de 40 partenaires (Apple, Microsoft, etc.), avec une enveloppe de 100 millions de dollars pour des scénarios de sécurité ; obtenir des ressources équivalentes est difficile pour les projets open source.
  • Les hypothèses de sécurité de la DeFi sont ébranlées : des contrats sur la chaîne verrouillent environ 2000 milliards de dollars. Après la perte de 285 millions de dollars subie par Drift sur Solana, le plan de sécurité STRIDE n’a été mis en ligne qu’ensuite. Les outils permettant de découvrir des vulnérabilités d’IA deviennent de plus en plus puissants : les protocoles qui n’ont pas fait de vérification formelle seront examinés par les déposants avec une tarification du risque plus sévère.
  • Les fonds suivent « l’IA responsable » : après le tour G d’Anthropic, l’évaluation implicite est d’environ 3800 milliards de dollars, ce qui montre que les investisseurs privilégient une approche orientée sécurité. RSP 3.0 pourra-t-il vraiment empêcher les abus : il faudra encore observer.

Les scores ne sont pas tout : la mise en ligne dépend du niveau d’exigence en sécurité et de la maîtrisabilité

Lors des achats par les entreprises, l’enjeu est « peut-on déployer en toute sécurité », pas « quelle place dans le classement ». Après une fuite, le secteur de la cybersécurité recule de 5–10 %, et comme aucun acteur concurrent ne réfute publiquement, cela indique que le marché valorise davantage la « défense / la gestion des risques » que la « puissance ».

Perspective Base Changement Évaluation
Orientation capacités BenchLM 99/100, premier pour la tâche d’agent, démonstration interne d’une chaîne de vulnérabilités Firefox Hausse des attentes des développeurs pour le codage IA / les workflows d’agents Peut être surestimé ; la fiabilité en environnement de production et le score sont deux choses différentes
Priorité sécurité Alliance Glasswing, découverte de failles zero-day (par exemple une faille FFmpeg datant de 16 ans) Les points faibles de l’infrastructure sont davantage pris en compte, et la sécurité assistée par IA progresse Sous-estimé ; la crédibilité d’Anthropic en tant que partenaire sécurité augmente, ce qui rend difficile pour les concurrents de rattraper
Prudence du marché Recul des actions “sécurité”, perte de 285 millions de dollars sur Solana Les investisseurs réévaluent le risque de diffusion sur un horizon de 6–18 mois Raisonnable à court terme ; à long terme, des technologies de défense pourraient générer un rendement excédentaire
Seuil de sécurité L’évaluation RSP ne touche pas un seuil d’autonomie “autonome” atteint, mais le modèle n’est pas encore en version publique Les secteurs réglementés préfèrent les modèles audités et les publications contrôlées Le cadre est efficace ; peu favorable aux chercheurs, mais les acheteurs conformes l’apprécient

Le consensus se resserre : plutôt que de demander « que l’IA peut encore faire », il vaut mieux demander « comment la faire agir à l’intérieur de ses limites ».

Informations clés

  • Mythos est puissant, mais uniquement en pilotes pour les entreprises : un haut score sur les benchmarks, plus des échantillons réels de zero-day, combinés à un accès anticipé au niveau entreprise, forment une combinaison de « haute capacité + accès strictement contrôlé ».
  • Le risque DeFi est en train d’être revalorisé : face à l’accélération des offensives et défenses IA sur des contrats à forte valeur, la vérification formelle et les audits de sécurité IA passeront de simple bonus à condition d’accès à l’écosystème.
  • Les fonds et le récit se renforcent mutuellement : le capital et les talents convergent vers des « modèles puissants et contrôlables », tandis que la situation de l’écosystème ouvert et de la recherche indépendante devient de plus en plus marginale.
  • La logique de décision pour la mise en ligne change : les seuils de sécurité, la capacité d’isolation, et la capacité d’être audité remplacent le « score des classements » comme principaux critères d’achat des entreprises.

Importance : Élevée
Catégorie : Publication de modèles|Sécurité IA|Impact sur le marché

Conclusion : les entreprises et les flux de capitaux valident déjà la position défensive d’Anthropic ; les Builder qui ne tiennent pas compte de l’intégration sécurité, et les chercheurs n’ayant pas de canal via les entreprises, voient le risque de marginalisation augmenter.

Jugement : du point de vue narratif, on est encore dans une phase « plutôt précoce, mais qui s’accélère » ; les mieux placés sont les Builder disposant de capacités de sécurité et de canaux de conformité, ainsi que les capitaux institutionnels. Les traders de deuxième niveau devraient davantage observer l’évolution de la mise en œuvre de la sécurité et de la structure d’accès : pour les participants qui ne détiennent qu’une exposition à l’écosystème ouvert, cette configuration n’est pas favorable.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler