Anthropicは12の大手企業と共同で「Glasswing」計画を立ち上げ、未公開の最強モデルMythosを用いて世界中のソフトウェアの脆弱性を修正します。

Project Glasswing は、防御者が迫り来る AI 主導のサイバーセキュリティ時代において持続的な優位性を築くための重要な一歩です。

著者: Anthropic

編集: 深潮 TechFlow

深潮導入: Anthropic は、未公開の最先端モデル Claude Mythos Preview をリリースしました。そのコード監査能力は、ほとんどの人間のセキュリティ専門家を超えており、自律的に数十年分のゼロデイ脆弱性を発見できます。

この能力に基づき、Anthropic は AWS、苹果、谷歌、微软、英伟达 など 12 のテクノロジー企業と連携して Project Glasswing 計画を立ち上げ、1 億ドルのクレジット枠を投入します。攻撃者が同等の能力を手に入れる前に、世界の重要ソフトウェアの脆弱性を先に塞ぐことが目標です。

はじめに

本日、私たちは Project Glasswing(玻璃翼計画)を発表します。これは、Amazon Web Services(AWS)、Anthropic、苹果、博通、思科、CrowdStrike、谷歌、摩根大通、Linux 基金会、微软、英伟达、Palo Alto Networks を結集した新たな取り組みであり、世界で最も重要なソフトウェアの安全性を守ることを目的としています。

私たちが Project Glasswing を立ち上げたのは、Anthropic が訓練した新しい最先端モデルが、ネットワークセキュリティの構図を変え得ると私たちが考える能力を示したためです。Claude Mythos Preview は、汎用的で、まだリリースされていない最先端モデルであり、残酷な事実を明らかにします。AI モデルのコーディング能力はすでにこの水準に達しており――ソフトウェアの脆弱性の発見と悪用の面で、それらは最も一流の専門家を除くすべての人を上回り得るのです。

Mythos Preview は、すでに数千個の高リスク脆弱性を発見しており、あらゆる主要なオペレーティングシステムと、あらゆる主要なブラウザを網羅しています。AI の進歩速度を考えると、この能力は遠くない将来に拡散し、責任のない利用者の手に渡る可能性があります。経済、公共の安全、国家安全保障への衝撃は極めて深刻になり得ます。Project Glasswing は、こうした能力を防御に優先的に用いるための緊急の試みです。

Project Glasswing の一環として、上記のパートナーは防御的なセキュリティ業務で Mythos Preview を使用します。Anthropic は学んだことを共有し、業界全体に還元します。さらに、40 を超える、重要なソフトウェア基盤を構築または維持している組織にもアクセスを開放し、それらが自社システムおよびオープンソースシステムをスキャンして強化できるようにします。Anthropic はこれに対し、Mythos Preview の使用枠として最大 1 億ドルを拠出し、またオープンソースのセキュリティ組織へ 400 万ドルを直接寄付すると約束しています。

Project Glasswing は単なる出発点です。どの組織も単独でサイバーセキュリティの問題を解決できるわけではありません。最先端の AI 開発者、他のソフトウェア企業、セキュリティ研究者、オープンソースのメンテナ、そして世界各国の政府には、それぞれ代替不可能な役割があります。世界のサイバー基盤を防御するには数年かかる可能性がある一方で、最先端の AI 能力は今後数か月で大きく飛躍するかもしれません。サイバー防御者が先行するには、今すぐ行動する必要があります。

AI 時代のサイバーセキュリティ

私たちが毎日依存しているソフトウェア――銀行システムの運転、医療記録の保管、物流ネットワークへの接続、電力網の稼働維持――には、常にバグがあります。大部分は無関係ですが、中には深刻な安全上の欠陥があり、一度発見されると攻撃者はシステムを乗っ取り、運用を麻痺させ、データを窃取できます。

サイバー攻撃が企業ネットワーク、医療システム、エネルギー基盤、交通のハブ、そして各国政府機関に与える破壊的な結果は、すでに広く明らかになっています。グローバルな規模では、中国、伊朗、朝鲜、俄罗斯からの国家レベルの攻撃が、民間の生活と軍事準備を支える基盤を脅かしています。単一の病院や学校を狙うような小規模な攻撃でさえ、重大な経済損失を招き、機微データを露出させ、さらには生命を危険にさらすことがあります。世界のサイバー犯罪による年間の経済的損失は正確に見積もるのが難しいものの、5000 億ドル程度になる可能性があります。

かつては、多くのソフトウェアの欠陥が何年も見つからなかったのは、それらを発見し悪用するために、ほんの一部のセキュリティ専門家だけが持つ専門知識が必要だったからです。しかし、最新の最先端 AI モデルの登場により、ソフトウェアの脆弱性の発見と悪用に必要なコスト、労力、専門的な参入障壁は大幅に下がりました。過去 1 年で AI モデルは、コードの読み取りと推論においてますます強くなっており、とりわけ脆弱性の発見や悪用の組み立ての面で驚異的です。Claude Mythos Preview は、これらのサイバーセキュリティ技能において飛躍的な向上を実現しています。モデルが発見したいくつかの脆弱性は、人間による審査が数十年続き、数百万回に及ぶ自動化セキュリティテストを経てもなお生き残っていました。また、モデルが開発した悪用コードもますます巧妙になっています。

初回の DARPA サイバー・グランド・チャレンジから 10 年後、最先端の AI モデルは、脆弱性の発見と悪用の能力において、最上位の人間に近づき、あるいは追い付こうとしています。必要なセーフガードがない場合、こうした強力なサイバー能力が、世界で最も重要なソフトウェアに残る大量の既知の欠陥を悪用するために使われ得ます。ネットワーク攻撃はより頻繁になり、より破壊的になり、米国およびその同盟国の相手方に力を与えてしまうかもしれません。これは民主国家が重視すべき安全保障上の優先事項です。

朗報は、AI モデルが誤った手に渡って危険になる原因となる能力が、重要なソフトウェア欠陥の発見と修復においても非常に価値がある――つまり、安全性のバグがより少ない新しいソフトウェアを生み出すのにも役立つ――ことです。Project Glasswing は、防御者が迫り来る AI 主導のサイバーセキュリティ時代において持続的な優位性を築くための重要な一歩です。

Claude Mythos Preview が脆弱性と悪用方法を発見する能力

ここ数週間、私たちは Claude Mythos Preview を使って、あらゆる主要なオペレーティングシステム、あらゆる主要なブラウザ、そして一連のその他の重要なソフトウェアの中で、数千のゼロデイ脆弱性(それまでソフトウェア開発者が完全に知らなかった欠陥)を発見しました。その多くは高リスクのものです。

Frontier Red Team 博客 では、そのうちの一部について、すでに修正された脆弱性の技術的詳細と、Mythos Preview が見つけた悪用方法を開示しました。これらの脆弱性の発見(および多くの関連する悪用方法の開発)は、モデルが完全に自律的に行ったものであり、いかなる人間の誘導もありません。以下に 3 つの例を示します。

  • Mythos Preview は OpenBSD で、存在が 27 年に及ぶ脆弱性を発見しました。OpenBSD は非常に高いセキュリティ強化水準で知られ、ファイアウォールやその他の重要インフラで広く利用されています。この脆弱性により、攻撃者はターゲットマシンへの接続だけで、遠隔からそれをクラッシュさせることが可能になります。
  • さらに、それは FFmpeg で、存在が 16 年に及ぶ脆弱性を発見しました。FFmpeg は無数のソフトウェアで動画のコーデックに使われています。問題は 1 行のコードにあり、自動化テストツールはその行を 500 万回ヒットさせていたにもかかわらず、問題を発見したことはありませんでした。
  • モデルは自律的に Linux カーネル内の複数の脆弱性を発見し、連結して、通常ユーザー権限から完全にマシンを制御する昇格攻撃を実現しました。

上記の脆弱性はすべて、関連するソフトウェアのメンテナに報告済みであり、いずれも修正されています。その他の多くの脆弱性についても、今日、詳細の暗号ハッシュ(Red Team 博客 を参照)を提供しています。修復が完了したのち、公開できる具体情報を提示します。

CyberGym などの評価ベンチマークもまた、Mythos Preview と、私たちの次に強いモデルである Claude Opus 4.6 との間に顕著な差があることを検証しています:

サイバーセキュリティ脆弱性の再現 - CyberGym

私たち自身の取り組みに加えて、多くのパートナーも数週間にわたり Claude Mythos Preview を使用しています。以下はそれらのフィードバックです:

「AI 能力はすでに 1 つの閾値を超え、重要インフラをサイバー脅威から守るために必要な緊急性を根本的に変え、しかも不可逆です。これらのモデルの基礎的な取り組みが示すように、ハードウェアとソフトウェアの安全上の脆弱性を、これまでにない速度と規模で識別し、修復できます。これは深い転換であり、明確なシグナルです。従来のシステム強化のやり方ではもう足りません。技術提供者は今すぐ新しい方法を積極的に採用し、顧客側も導入準備を整える必要があります。これが Cisco が Project Glasswing に加わった理由です――この取り組みはあまりに重要で、あまりに緊急であり、単独では成し得ません。」

—— Anthony Grieco、思科 上級副社長 兼 首席セキュリティ & トラストオフィサー

「AWS では、脅威が現れる前に防御を構築しています。カスタムチップからテクノロジースタック全体までです。セキュリティは特定の段階のものではなく、継続的なものであり、私たちが行うすべてに組み込まれています。私たちのチームは脅威検知のために毎日 400 万億回以上のネットワークトラフィックを分析しており、AI は私たちの大規模防御能力の中核です。私たちは自社のセキュリティ運用で Claude Mythos Preview を継続的にテストし、重要なコードベースに適用しています。すでにそれがコードの強化に役立っています。私たちは Anthropic との連携に深いセキュリティ専門知識を注ぎ込み、Claude Mythos Preview をより強固にすることで、より多くの組織が最高の安全基準で取り組みを前進できるよう支援しています。」

—— Amy Herzog、亚马逊云科技(AWS) 副社長 兼 首席情報セキュリティオフィサー

「サイバーセキュリティが純粋に人的な能力に制約されないなら、責任ある形で AI を大規模に活用しセキュリティを強化してリスクを低減する機会は前例がありません。Project Glasswing に参加し、Claude Mythos Preview のアクセスを得ることで、私たちはより早い段階でリスクを特定し、緩和し、セキュリティおよび開発ソリューションを強化することができ、その結果として顧客と微软をより適切に守れます。オープンソースのセキュリティベンチマークである CTI-REALM をテストした際、Claude Mythos Preview は先行するモデルに比べて実質的な改善を示しました。私たちは Anthropic および、より広範な業界との連携を通じて、すべての人のセキュリティ成果を改善していくことを楽しみにしています。」

—— Igor Tsyganskiy、微软 ネットワークセキュリティ 兼 微软研究 実行副社長

「脆弱性が発見されてから攻撃者が悪用するまでのウィンドウは崩れ去っています。これまでは数か月かかっていたものが、AI なら数分で完了します。Claude Mythos Preview は、防御者が大規模に動ける可能性を示しています。一方で、相手は同様の能力を悪用するために必ず求めてくるでしょう。これは歩みを遅らせる理由ではなく、一緒に前進を加速させる理由です。AI を展開するには、安全の保障が不可欠です。これが CrowdStrike が初日から参画している理由です。」

—— Elia Zaitsev、CrowdStrike 最高技術責任者

「これまで、セキュリティの専門知識は巨大なセキュリティチームを抱える組織だけが享受できる贅沢でした。オープンソースソフトウェアのメンテナ――それらのソフトが世界の大部分の重要インフラを支えている――は、従来、セキュリティの問題に対処するための手段を自分たちで見つけるしかありませんでした。オープンソースソフトウェアは現代のシステムにおけるコードの大半を構成しており、AI エージェントが新しいソフトウェアを書くために用いるシステムそのものも含まれます。これらの重要なオープンソースコードベースのメンテナに、新世代の AI モデルへのアクセスを提供する――脆弱性を大規模かつ積極的に特定し修復できる――Project Glasswing は、この状況を変える現実的な道筋を提示しています。これは、AI 強化セキュリティが、大チームだけの専用ツールから、あらゆるメンテナの信頼できるアシスタントへと変わっていく、そのあり方です。」

—— Jim Zemlin、Linux 基金会 CEO

「金融システムのサイバーセキュリティとレジリエンスを促進することは、摩根大通 の使命の中核です。私たちは、先導する機関が一緒になって挑戦し、協力することで、業界が最も強くなると信じています。Project Glasswing は、次世代の AI ツールが重要インフラの防御的なサイバーセキュリティにおいてどのような能力を持つのかを、私たち自身の基準で評価できるという独自の早期機会を提供します。同時に、尊敬される技術リーダーの隣で戦えます。私たちは、厳密で独立したアプローチで、どのように進め、どのように支援するかを判断します。Anthropic の取り組みは、この瞬間に求められる先見性と、協調的な姿勢を体現しています。」

—— Pat Opet、摩根大通 首席情報セキュリティオフィサー

「谷歌 は、このような異業種にまたがるサイバーセキュリティの取り組みが形成されることを嬉しく思っており、Vertex AI を通じて参加者に Mythos Preview を提供します。新たに生じるセキュリティ課題に対する業界の協力は常に重要です。ポスト量子暗号、責任あるゼロデイ脆弱性の開示、オープンソースソフトウェアのセキュリティ、そして AI による攻撃への防御のいずれにおいても同様です。私たちは、AI がサイバーディフェンスにも新しい課題と新しい機会の両方をもたらすとずっと信じてきました。だからこそ、重要なソフトウェア欠陥の発見と修復のために Big Sleep や CodeMender といった AI 駆動ツールを構築してきたのです。私たちは、ユーザー、顧客、エコシステム、国家安全保障の保護を中核に据える、先進的なサイバーセキュリティプラットフォームと文化への投資を継続していきます。」

—— Heather Adkins、谷歌 セキュリティエンジニアリング 副社長

「過去数週間、私たちは Claude Mythos Preview を使って、前世代のモデルが完全に見落としていた複雑な脆弱性を特定しています。これは、隠れた脆弱性を見つける“ゲーム”のルールを変えるだけでなく、攻撃者がこれまで以上に速く、より多くのゼロデイ脆弱性を発見し、悪用コードを開発できるようになることを意味します。明らかに、これらのモデルは、攻撃者がアクセス権を得る前に脆弱性を発見し修復できるように、オープンソースプロジェクトのオーナーや、あらゆる防御者の手に渡される必要があります。おそらくさらに重要なのは、誰もが AI によって支援される攻撃者に備える必要があるということです。攻撃はより増え、より速く、より複雑になります。いまこそ、サイバーセキュリティ体制を全体的にアップグレードするタイミングです。私たちは Anthropic と業界が連携し、これらの強力な能力が防御に優先的に向けられるようにすることを評価しています。」

—— Lee Klarich、Palo Alto Networks 最高製品・技術責任者

Claude Mythos Preview の強力なサイバーセキュリティ能力は、その卓越したエージェントによるコーディングと推論能力に由来します。以下の評価結果は、このモデルが複数のソフトウェアコーディングタスクにおいて、既知のすべてのモデルの中で最高得点を獲得したことを示しています。

エージェントによるコーディング

推論

エージェント検索とコンピュータ使用

注記:

  • SWE-bench Verified、Pro、Multilingual:メモ化スクリーニングのラベルが一部の課題に適用されています。メモ化の可能性がある課題を除外しても、Mythos Preview の Opus 4.6 に対する優位性の幅は変わりません。
  • SWE-bench Multimodal:内部実装を使用しており、スコアは公開ランキングと直接比較できません。
  • Terminal-Bench 2.0:Terminus-2 フレームワークを使用し、自適応思考モードで最大限努力します。各タスクの総予算は 100 万 token、1 倍保証 / 3 倍上限のリソース配分で、各タスクあたり 5 回の試行を行い平均します。タイムアウト制限を 4 時間に引き上げ、Terminal-Bench 2.1 で更新したのち、Mythos Preview のスコアは 92.1% でした。
  • BrowseComp:Claude Mythos Preview のスコアは Opus 4.6 より高く、同時に token 消費量は後者の 1/4.9 です。
  • Humanity’s Last Exam:Mythos は低努力モードでも良好な性能を示しており、ある程度のメモ化がある可能性があります。

当該モデルの能力、安全特性、基本的な特徴に関する詳細は、Claude Mythos Preview のシステムカードをご覧ください。

私たちは Claude Mythos Preview を一般向けに公開する予定はありませんが、最終的な目標は、ユーザーが Mythos レベルのモデルを安全に大規模展開できるようにすることです――ネットワークセキュリティだけでなく、このような高能力モデルがもたらす多くのその他の価値にも使えるようにしたいと考えています。そのためには、ネットワークセキュリティ(およびその他)の安全防御策の開発を前進させ、モデルが最も危険な出力を生成したときに検知し阻止できる必要があります。私たちは、まもなく提供される Claude Opus モデルに新しい安全防護策を公開し、それによって、Mythos Preview と同等のリスク水準を持たないモデルを用いて、これらの対策を改善し、洗練させる計画です。

Project Glasswing の次のステップ

今回のリリースは、長期的な取り組みの始まりです。成功には、技術業界の内外を問わず、幅広い参加が必要です。

Project Glasswing のパートナーは Claude Mythos Preview へのアクセスを得ます。これを用いて、基盤となるシステム内の脆弱性や弱点を発見し修復します。これらのシステムは、世界の共有されたサイバー攻撃面の大きな割合を占めています。作業の重点は、ローカルの脆弱性検出、バイナリのブラックボックステスト、エンドポイント強化、システム侵入テストを含むと見込まれます。

Anthropic は、Project Glasswing およびその他の参加者に約束した 1 億ドル分のモデル使用枠によって、研究プレビュー期間中の大半の利用をカバーします。その後、Claude Mythos Preview は参加者に対し、100 万入力 / 出力 token あたり 25 米ドル / 125 米ドルの価格で提供されます(参加者は Claude API、Amazon Bedrock、Google Cloud Vertex AI、Microsoft Foundry からこのモデルにアクセスできます)。

モデル使用枠に加え、私たちは Linux 基金会 を通じて Alpha-Omega と OpenSSF に 250 万ドルを寄付し、Apache ソフトウェア基金会 に 150 万ドルを寄付しました。これは、オープンソースソフトウェアのメンテナがこの変化する状況に対応できるよう支援するためです(関心のあるメンテナは Claude for Open Source プログラムからアクセスを申請できます)。

私たちは、この取り組みを範囲として継続的に拡張し、数か月にわたって進めることを考えており、可能な限り多くの経験を共有して、他の組織もそれらを自らのセキュリティに適用できるようにしたいと考えています。パートナーは、条件が許す範囲で互いに情報とベストプラクティスを共有します。90 日以内に、Anthropic は私たちの発見と、開示可能な修正済み脆弱性および改善策について、公開レポートを出します。また、先進的なセキュリティ組織と連携して、AI 時代におけるセキュリティ実践の進化に関する実用的な提言を策定します。そこには、たとえば以下が含まれ得ます:脆弱性開示プロセス、ソフトウェア更新プロセス、オープンソースおよびサプライチェーンセキュリティ、ソフトウェア開発ライフサイクルとセキュリティ設計実践、規制対象業界の標準、優先順位付けの拡張と自動化、そしてパッチ自動化。

Anthropic は、米国政府官員と、Claude Mythos Preview の攻防に関するサイバーセキュリティ能力について継続的に議論を重ねてきました。重要インフラの保護は民主国家の最優先の国家安全保障事項です。これらのサイバーセキュリティ能力の登場は、米国およびその同盟国が AI 技術において決定的に優位であり続ける必要があることを改めて示しています。政府は、この優位性の維持や、AI モデルに関連する国家安全保障リスクの評価と緩和において不可欠な役割を担います。私たちは、あらゆるレベルの政府代表と連携し、これらの任務の遂行を支援する用意があります。

私たちは、Project Glasswing が、民間部門と公共部門の両方をカバーするより大規模な取り組みを生み出し、強力なモデルによるセキュリティへの影響に関する最大の問題に、関係各者がともに対処することを望んでいます。ほかの AI 業界のメンバーにも参加を呼びかけ、業界標準の策定を支援してもらいたいと考えています。中期的には、民間と公共の双方の組織を集約できる独立した第三者機関――こうした大規模なサイバーセキュリティプロジェクトの後続業務を担う理想的なプラットフォームになる可能性があります。

補足

  1. 本プロジェクトはガラスの翼蝶(Greta oto)にちなんで命名されています。この隠喩には 2 つの含意があります。透明な翼を持つ蝶は、本文で議論しているようなコードに潜む脆弱性のように、目に見えないところに身を隠せることです。また透明な翼は、私たちが提唱する透明性の方法と同様に、危害を回避するのにも役立ちます。
  2. Mythos という語は古代ギリシャ語に由来し、「叙事」または「物語」を意味します。文明が世界を理解するために用いる物語の体系です。
  3. これらの安全防護策の影響を受けずに適法に業務を行えるセキュリティ専門家は、まもなく提供されるネットワークセキュリティ検証プログラム(Cyber Verification Program)に申請できます。
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン