Project Glasswing は単なる出発点にすぎません。どの機関も単独でサイバーセキュリティの問題を解決できるわけではありません。最先端の AI 開発者、他のソフトウェア企業、セキュリティ研究者、オープンソースの保守者、そして各国政府には、それぞれ欠かせない役割があります。世界のサイバーインフラを守るには数年かかるかもしれませんが、最先端の AI 能力は今後数か月で大きく飛躍する可能性があります。ネットワーク防御側が先手を取るには、今すぐ行動する必要があります。
過去には、多くのソフトウェア欠陥が長年発見されないままでした。なぜなら、それらを見つけて悪用するには、極めて少数の安全専門家だけが持つ専門知識が必要だったからです。しかし、最新の最先端 AI モデルの登場により、ソフトウェア脆弱性の発見と悪用に必要なコスト、労力、専門性のハードルが大幅に下がりました。過去 1 年で、AI モデルはコード読解と推論においてますます強くなり、特に脆弱性の発見や悪用の構築において驚異的に成果を示しています。Claude Mythos Preview は、こうしたサイバーセキュリティスキルで飛躍的な向上を実現しました。たとえば、人間が審査に何十年も費やし、数百万回の自動化セキュリティテストを経てもなお生き残っていたいくつかの脆弱性を発見し、さらに開発した悪用コードもますます巧妙になっています。
初回の DARPA Cyber Grand Challenge から 10 年が経つ今、最先端の AI モデルは、最上位の人間に対して脆弱性発見・悪用能力で近づく、あるいは追いつくところまで来ています。必要なセキュリティ対策がなければ、こうした強力なサイバー能力は、世界で最も重要なソフトウェアに存在する大量の既知欠陥を悪用するために使われ得ます。ネットワーク攻撃はより頻繁になり、より破壊的になり、そして米国およびその同盟国の対手に力を与えるでしょう。これは、民主国家が重視すべき安全保障上の優先事項です。
朗報は、AI モデルを誤った手に渡すと危険になる能力が、重要なソフトウェア欠陥の発見と修復においても非常に価値があることです。つまり、安全なバグがより少ない新しいソフトウェアの創出にも役立ちます。Project Glasswing は、防御側が、迫り来る AI ドリブンのサイバーセキュリティ時代において持続的な優位性を築くための重要な一歩です。
Claude Mythos Preview が脆弱性と悪用の手法を発見する能力
過去数週間、私たちは Claude Mythos Preview を、あらゆる主要なオペレーティングシステム、あらゆる主要なブラウザ、そして一連のその他の重要なソフトウェアに対して使用し、それらの中で数千のゼロデイ脆弱性(これまでソフトウェア開発者がまったく知らなかった欠陥)を発見しました。その多くは高危険度のものです。
Frontier Red Team のブログでは、修正済みとなった一部の脆弱性の技術的詳細と、Mythos Preview が見つけた悪用方法を開示しました。これらの脆弱性の発見(および多くの関連する悪用方法の開発)は、モデルが完全に自律的に実施したものであり、いかなる人間のガイドもありませんでした。以下に 3 つの例を示します。
「これまでセキュリティ専門知識は、巨大なセキュリティチームを持つ組織だけが享受できる贅沢でした。オープンソースのソフトウェア保守者――それらのソフトウェアが世界の大部分の重要インフラを支えている――は、従来、安全上の問題を自分たちで何とか解決するしかありませんでした。オープンソースソフトウェアは、現代のシステムにおけるコードの大半を構成しており、AI エージェントが新しいソフトウェアを書くために用いるシステム自体も含まれます。これらの重要なオープンソースコードベースの保守者に、新世代の AI モデルへのアクセスを提供し――大規模に能動的に脆弱性を識別・修復できるようにする――ことによって、Project Glasswing はこの状況を変えるための現実的な道筋を示しました。これが、AI 強化によるセキュリティが、大チームだけの専用ツールから、すべての保守者の信頼できるアシスタントへと変わっていく方法です。」
―― Jim Zemlin、Linux Foundation CEO
「金融システムのサイバーセキュリティとレジリエンスを促進することが、J.P.モルガンのミッションの中心です。私たちは、先行する機関が互いに挑戦し連携するとき、業界は最も強くなると信じています。Project Glasswing は、次世代の AI ツールが重要インフラ防御のサイバーセキュリティにおいてどのような能力を持つかを、自分たちの基準で早期に評価できるという独自の機会を提供します。同時に、尊敬される技術リーダーの皆さんと肩を並べて戦うこともできます。私たちは、どのように前へ進め、どのように支援するかを決めるために、厳密で独立したアプローチを取ります。Anthropic の取り組みは、この瞬間に必要な先見性と協調の姿勢を体現しています。」
―― Pat Opet、J.P.モルガン チーフインフォメーションセキュリティオフィサー
「Google は、このような業界横断のサイバーセキュリティの取り組みが形成されるのを喜ばしく思い、Vertex AI を通じて参加者に Mythos Preview を提供します。新たに生じるセキュリティ課題に対する業界の協力は、後量子暗号、責任あるゼロデイの脆弱性開示、オープンソースソフトウェアのセキュリティ、防御型 AI による攻撃のいずれであっても、ずっと重要です。私たちは、AI がサイバーディフェンスにも新しい課題と新しい機会の両方をもたらすとずっと信じてきました。だからこそ、Big Sleep や CodeMender のような AI 驆動ツールを構築し、重要なソフトウェアの欠陥を発見・修復するのです。私たちは、ユーザー、顧客、エコシステム、そして国家安全を守ることを中核に据えた、先進のサイバーセキュリティ基盤への投資を継続します。」
―― Heather Adkins、Google セキュリティエンジニアリング副社長
「過去数週間、私たちは Claude Mythos Preview モデルを使い、前世代のモデルが完全に見落としていた複雑な脆弱性を特定してきました。これは、隠れた脆弱性を見つけるゲームのルールを変えただけでなく、攻撃者がこれまでよりもさらに速くより多くのゼロデイ脆弱性を見つけ、悪用コードを開発できるようになることも意味します。明らかに、これらのモデルは、攻撃者がアクセス権を得る前に脆弱性を発見・修正できるよう、オープンソースプロジェクトの所有者や防御側に渡される必要があります。さらに重要なのは、誰もが AI に支援された攻撃者に備える必要があるということです。攻撃はもっと増え、もっと速く、もっと複雑になります。今こそ、サイバーセキュリティ体制を全面的にアップグレードするときです。私たちは、強力な能力が確実に防御に優先して役立つよう、Anthropic が業界と協力していることを評価します。」
―― Lee Klarich、Palo Alto Networks チーフプロダクト&テクノロジーオフィサー
Claude Mythos Preview の強力なサイバーセキュリティ能力は、その卓越したエージェントのコーディングと推論能力に由来しています。以下の評価結果は、このモデルが多くのソフトウェアコーディングタスクにおいて、既知のモデルすべての中で最高スコアを獲得したことを示しています。
エージェントのコーディング
推論
エージェント検索とコンピューター利用
注:
SWE-bench Verified、Pro、Multilingual:キャッシュ(記憶化)スクリーニングが一部の問題を除外しています。記憶化の可能性がある問題を除いた後でも、Mythos Preview の Opus 4.6 に対する優位の幅は変わりません。
私たちは Claude Mythos Preview を一般公開する計画はありませんが、最終的な目標は、ユーザーが安全に Mythos レベルのモデルを大規模に展開できるようにすることです――それはサイバーセキュリティだけでなく、このような高能力モデルがもたらす他の多くの価値のためにも使われます。そのために、私たちは(ネットワークセキュリティを含む)安全な防護策の開発において進展を遂げ、モデルが最も危険な出力を検出して阻止できる必要があります。私たちは、今後リリース予定の Claude Opus モデルに新しい安全防護措置を投入し、Mythos Preview と同等のリスク水準を持たないモデルでそれらの措置を改良し、補完できるようにする計画です。
モデル利用枠に加えて、私たちは Linux Foundation を通じて Alpha-Omega および OpenSSF にそれぞれ 250 万ドル、Apache Software Foundation に 150 万ドルを寄付し、オープンソースソフトウェアの保守者がこの変化の状況に対応できるよう支援します(関心のある保守者は Claude for Open Source プランからアクセスを申請できます)。
Anthropic はまた、米国政府の当局者と、Claude Mythos Preview の攻防におけるサイバーセキュリティ能力について継続的に協議しています。重要インフラを守ることは、民主国家にとって最優先の国家安全保障事項です。これらのサイバーセキュリティ能力の登場は、米国および同盟国が AI 技術において決定的なリードを維持しなければならないことを、改めて示しています。政府には、このリードを維持する支援や、AI モデルに関連する国家安全保障リスクの評価と緩和において、欠かせない役割があります。私たちは、あらゆるレベルの政府代表と協力し、これらの任務を支援することを望みます。
私たちは、Project Glasswing が、産業界と公共部門をまたぐより大規模な取り組みを生み出し、強力なモデルがセキュリティに与える影響の最大の問題に対して、関係者が共に対応できるようになることを期待しています。私たちは、他の AI 業界のメンバーにも加わっていただき、業界標準の策定を支援してもらいたいと考えています。中期的には、民間と公共部門の組織を集約できる独立した第三者機関が、これらの大規模なサイバーセキュリティプロジェクトの今後の業務を担う理想的なプラットフォームになる可能性があります。
Anthropicは12の大手企業と共同で「Glasswing」計画を立ち上げ、未公開の最強モデルMythosを用いて世界中のソフトウェアの脆弱性を修正します。
作者: Anthropic
編集: 深潮 TechFlow
深潮解説: Anthropic は、まだ公開されていない最先端モデル「Claude Mythos Preview」を発表しました。そのコード監査能力は、ほとんどすべての人間の安全専門家を上回り、自律的に数十年にわたるゼロデイ脆弱性を発見できる能力を備えています。
この能力に基づき、Anthropic は AWS、アップル、グーグル、マイクロソフト、NVIDIA など 12 のテクノロジー大手と連携して Project Glasswing 計画を立ち上げました。1 億ドルのクレジット枠を投入し、攻撃者が同等の能力を手に入れる前に、世界の重要なソフトウェアの脆弱性を先に塞ぐことを目標としています。
はじめに
本日、私たちは Project Glasswing(Glasswing プロジェクト、ガラスの翼計画)を発表します。これは、Amazon ウェブテクノロジーズ(AWS)、Anthropic、アップル、ブロードコム、シスコ、CrowdStrike、グーグル、J.P.モルガン、Linux Foundation、マイクロソフト、NVIDIA、Palo Alto Networks が集結した新たな取り組みであり、世界で最も重要なソフトウェアのセキュリティを守ることを目的としています。
私たちが Project Glasswing を立ち上げたのは、Anthropic が訓練した新しい最先端モデルが、私たちの考えるネットワークセキュリティの状況を根本から変える可能性がある能力を示したからです。Claude Mythos Preview は、まだリリースされていない汎用の最先端モデルであり、厳しい事実を明らかにしています。つまり、AI モデルのコーディング能力は、発見とソフトウェア脆弱性の悪用に関して、最上位の専門家を除くすべての人を上回るほどの水準に到達しているということです。
Mythos Preview は、すでに数千の高リスクの脆弱性を発見しており、あらゆる主要なオペレーティングシステム、あらゆる主要なブラウザに及びます。AI の進歩速度を踏まえると、この能力は近い将来に広がり、責任を持たない利用者の手に渡る可能性があります。経済、公的安全、国家安全への影響は非常に深刻になり得ます。Project Glasswing は、これらの能力を防御に優先的に振り向けるための差し迫った試みです。
Project Glasswing の一環として、上記のパートナーは防御的なセキュリティ活動に Mythos Preview を使用します。Anthropic は学びを共有し、業界全体に役立てます。さらに、重要なソフトウェア基盤を構築または保守する別の 40 以上の組織にもアクセスを開放し、それらが自社のシステムおよびオープンソースシステムをスキャンし、強化できるようにします。Anthropic はこれに対し、最大 1 億ドルの Mythos Preview 利用クレジット枠、ならびにオープンソースのセキュリティ組織への直接寄付 400 万ドルを拠出することを約束します。
Project Glasswing は単なる出発点にすぎません。どの機関も単独でサイバーセキュリティの問題を解決できるわけではありません。最先端の AI 開発者、他のソフトウェア企業、セキュリティ研究者、オープンソースの保守者、そして各国政府には、それぞれ欠かせない役割があります。世界のサイバーインフラを守るには数年かかるかもしれませんが、最先端の AI 能力は今後数か月で大きく飛躍する可能性があります。ネットワーク防御側が先手を取るには、今すぐ行動する必要があります。
AI 時代のサイバーセキュリティ
私たちが毎日依存しているソフトウェア――銀行システムを動かし、医療記録を保存し、物流ネットワークに接続し、電力網の運転を維持する――には、これまでもずっとバグがありました。多くは些細ですが、なかには重大なセキュリティ上の欠陥もあり、一度発見されると攻撃者はシステムを乗っ取り、運用を停止させ、データを窃取できるようになります。
サイバー攻撃による企業ネットワーク、医療システム、エネルギー基盤、交通の拠点、各国政府機関への破壊的な影響は、すでに明らかになっています。世界規模では、中国、イラン、北朝鮮、ロシアからの国家レベルの攻撃が、民間の生活と軍事準備を支えるインフラを脅かしています。たとえ単一の病院や学校を対象とした小規模な攻撃であっても、大きな経済的損失を生み、機微なデータを露出させ、命を危険にさらすことさえあります。世界のサイバー犯罪による年間の経済損失は正確に見積もるのは難しいものの、5000 億ドル程度になる可能性があります。
過去には、多くのソフトウェア欠陥が長年発見されないままでした。なぜなら、それらを見つけて悪用するには、極めて少数の安全専門家だけが持つ専門知識が必要だったからです。しかし、最新の最先端 AI モデルの登場により、ソフトウェア脆弱性の発見と悪用に必要なコスト、労力、専門性のハードルが大幅に下がりました。過去 1 年で、AI モデルはコード読解と推論においてますます強くなり、特に脆弱性の発見や悪用の構築において驚異的に成果を示しています。Claude Mythos Preview は、こうしたサイバーセキュリティスキルで飛躍的な向上を実現しました。たとえば、人間が審査に何十年も費やし、数百万回の自動化セキュリティテストを経てもなお生き残っていたいくつかの脆弱性を発見し、さらに開発した悪用コードもますます巧妙になっています。
初回の DARPA Cyber Grand Challenge から 10 年が経つ今、最先端の AI モデルは、最上位の人間に対して脆弱性発見・悪用能力で近づく、あるいは追いつくところまで来ています。必要なセキュリティ対策がなければ、こうした強力なサイバー能力は、世界で最も重要なソフトウェアに存在する大量の既知欠陥を悪用するために使われ得ます。ネットワーク攻撃はより頻繁になり、より破壊的になり、そして米国およびその同盟国の対手に力を与えるでしょう。これは、民主国家が重視すべき安全保障上の優先事項です。
朗報は、AI モデルを誤った手に渡すと危険になる能力が、重要なソフトウェア欠陥の発見と修復においても非常に価値があることです。つまり、安全なバグがより少ない新しいソフトウェアの創出にも役立ちます。Project Glasswing は、防御側が、迫り来る AI ドリブンのサイバーセキュリティ時代において持続的な優位性を築くための重要な一歩です。
Claude Mythos Preview が脆弱性と悪用の手法を発見する能力
過去数週間、私たちは Claude Mythos Preview を、あらゆる主要なオペレーティングシステム、あらゆる主要なブラウザ、そして一連のその他の重要なソフトウェアに対して使用し、それらの中で数千のゼロデイ脆弱性(これまでソフトウェア開発者がまったく知らなかった欠陥)を発見しました。その多くは高危険度のものです。
Frontier Red Team のブログでは、修正済みとなった一部の脆弱性の技術的詳細と、Mythos Preview が見つけた悪用方法を開示しました。これらの脆弱性の発見(および多くの関連する悪用方法の開発)は、モデルが完全に自律的に実施したものであり、いかなる人間のガイドもありませんでした。以下に 3 つの例を示します。
Mythos Preview は OpenBSD に存在する 27 年ものの脆弱性を発見しました。OpenBSD は非常に高いセキュリティ強化水準で知られており、ファイアウォールやその他の重要な基盤で広く利用されています。この脆弱性により、攻撃者はターゲットマシンに接続するだけで、リモートからそれをクラッシュさせることができます。
また、FFmpeg に 16 年の脆弱性を見つけました。FFmpeg は、無数のソフトウェアで動画のコーデックに使われています。問題は 1 行のコードにあり、自動化テストツールはその行に 500 万回ヒットしていたにもかかわらず、問題を見つけたことがありませんでした。
このモデルは Linux カーネル内のいくつかの脆弱性を自律的に発見し連結し(Linux カーネルは世界の大半のサーバで動作しています)、一般ユーザー権限から完全にマシンを制御する権限昇格攻撃を実現しました。
上記の脆弱性については、すべて関連ソフトウェアの保守者に報告し、いずれも修正されています。その他の多くの脆弱性については、本日、暗号化ハッシュの形で詳細を提供しています(Red Team のブログを参照)。修正が完了した時点で、具体的な情報を公開します。
CyberGym などの評価ベンチマークも、Mythos Preview と私たちの次点モデルである Claude Opus 4.6 の間に明確な差があることを検証しています。
ネットワークセキュリティ脆弱性の再現 - CyberGym
私たち自身の作業に加えて、多くのパートナーも数週間にわたり Claude Mythos Preview を使用しています。以下はそれらのフィードバックです。
「AI 能力はすでに一つの閾値を超え、重要インフラをサイバー脅威から守るために求められる切迫度を根本的に変え、不可逆的にしたのです。私たちは、これらのモデルの基礎作業によって、これまでにない速度と規模でハードウェアとソフトウェアのセキュリティ脆弱性を識別し、修復できることを示しました。これは深い変化であり、明確なシグナルでもあります。従来のシステムの強化(ハードニング)方法ではもう十分ではないのです。技術提供者は新しい方法をただちに積極的に採用しなければならず、顧客も導入の準備をしておく必要があります。これが Cisco が Project Glasswing に参加した理由です――この取り組みは重要で、急を要しており、単独で成し遂げることはできません。」
―― Anthony Grieco、Cisco シニアバイスプレジデント兼チーフセキュリティ&トラストオフィサー
「AWS では、脅威が顕在化する前から防御を構築しています。専用チップからテクノロジースタック全体まで。セキュリティは特定の段階の問題ではなく、継続的なものであり、私たちが行うあらゆることに組み込まれています。私たちのチームは、脅威を検知するために毎日 400 万兆回を超えるネットワークトラフィックを分析しています。AI は、私たちの大規模な防御能力の中核です。私たちは自社のセキュリティ運用において Claude Mythos Preview を常にテストし、それを重要なコードベースに適用しています。すると、それはすでにコードの強化に役立っています。私たちは Anthropic との連携に深いセキュリティ専門知識を注ぎ込み、Claude Mythos Preview を強化して、より多くの組織が最高のセキュリティ基準で業務を前進できるようにすることを進めています。」
―― Amy Herzog、AWS 副社長兼最高情報セ安全責任者(Chief Information Security Officer)
「サイバーセキュリティが純粋に人の能力に制約されなくなったとき、責任ある形で AI を活用して大規模にセキュリティを強化し、リスクを低減する機会は前例のないものです。Project Glasswing に参加し、Claude Mythos Preview のアクセス権を得ることで、リスクをできるだけ早期に特定し、緩和し、そして私たちのセキュリティおよび開発ソリューションを強化して、より良く顧客と Microsoft を守ることができます。オープンソースのセキュリティベンチマーク CTI-REALM をテストしたところ、Claude Mythos Preview は従来モデルに比べて実質的な改善を示しました。私たちは Anthropic およびより広い業界と協力し、すべての人のセキュリティ成果を改善できることを楽しみにしています。」
―― Igor Tsyganskiy、Microsoft サイバーセキュリティ&Microsoft Research 執行副社長
「脆弱性が発見されてから攻撃者に悪用されるまでの“窓”は崩れ落ちています。以前は数か月かかっていたことが、AI なら数分で完了します。Claude Mythos Preview は、防御側が大規模に行動できる可能性を示しています。そして、対手は同様の能力を悪用することを不可避的に求めるでしょう。これは歩みを遅くする理由ではなく、共に前進を加速する理由です。AI を展開するには、セキュリティ面の保証が必要です。これが CrowdStrike が初日から関わっている理由です。」
―― Elia Zaitsev、CrowdStrike チーフテクノロジーオフィサー
「これまでセキュリティ専門知識は、巨大なセキュリティチームを持つ組織だけが享受できる贅沢でした。オープンソースのソフトウェア保守者――それらのソフトウェアが世界の大部分の重要インフラを支えている――は、従来、安全上の問題を自分たちで何とか解決するしかありませんでした。オープンソースソフトウェアは、現代のシステムにおけるコードの大半を構成しており、AI エージェントが新しいソフトウェアを書くために用いるシステム自体も含まれます。これらの重要なオープンソースコードベースの保守者に、新世代の AI モデルへのアクセスを提供し――大規模に能動的に脆弱性を識別・修復できるようにする――ことによって、Project Glasswing はこの状況を変えるための現実的な道筋を示しました。これが、AI 強化によるセキュリティが、大チームだけの専用ツールから、すべての保守者の信頼できるアシスタントへと変わっていく方法です。」
―― Jim Zemlin、Linux Foundation CEO
「金融システムのサイバーセキュリティとレジリエンスを促進することが、J.P.モルガンのミッションの中心です。私たちは、先行する機関が互いに挑戦し連携するとき、業界は最も強くなると信じています。Project Glasswing は、次世代の AI ツールが重要インフラ防御のサイバーセキュリティにおいてどのような能力を持つかを、自分たちの基準で早期に評価できるという独自の機会を提供します。同時に、尊敬される技術リーダーの皆さんと肩を並べて戦うこともできます。私たちは、どのように前へ進め、どのように支援するかを決めるために、厳密で独立したアプローチを取ります。Anthropic の取り組みは、この瞬間に必要な先見性と協調の姿勢を体現しています。」
―― Pat Opet、J.P.モルガン チーフインフォメーションセキュリティオフィサー
「Google は、このような業界横断のサイバーセキュリティの取り組みが形成されるのを喜ばしく思い、Vertex AI を通じて参加者に Mythos Preview を提供します。新たに生じるセキュリティ課題に対する業界の協力は、後量子暗号、責任あるゼロデイの脆弱性開示、オープンソースソフトウェアのセキュリティ、防御型 AI による攻撃のいずれであっても、ずっと重要です。私たちは、AI がサイバーディフェンスにも新しい課題と新しい機会の両方をもたらすとずっと信じてきました。だからこそ、Big Sleep や CodeMender のような AI 驆動ツールを構築し、重要なソフトウェアの欠陥を発見・修復するのです。私たちは、ユーザー、顧客、エコシステム、そして国家安全を守ることを中核に据えた、先進のサイバーセキュリティ基盤への投資を継続します。」
―― Heather Adkins、Google セキュリティエンジニアリング副社長
「過去数週間、私たちは Claude Mythos Preview モデルを使い、前世代のモデルが完全に見落としていた複雑な脆弱性を特定してきました。これは、隠れた脆弱性を見つけるゲームのルールを変えただけでなく、攻撃者がこれまでよりもさらに速くより多くのゼロデイ脆弱性を見つけ、悪用コードを開発できるようになることも意味します。明らかに、これらのモデルは、攻撃者がアクセス権を得る前に脆弱性を発見・修正できるよう、オープンソースプロジェクトの所有者や防御側に渡される必要があります。さらに重要なのは、誰もが AI に支援された攻撃者に備える必要があるということです。攻撃はもっと増え、もっと速く、もっと複雑になります。今こそ、サイバーセキュリティ体制を全面的にアップグレードするときです。私たちは、強力な能力が確実に防御に優先して役立つよう、Anthropic が業界と協力していることを評価します。」
―― Lee Klarich、Palo Alto Networks チーフプロダクト&テクノロジーオフィサー
Claude Mythos Preview の強力なサイバーセキュリティ能力は、その卓越したエージェントのコーディングと推論能力に由来しています。以下の評価結果は、このモデルが多くのソフトウェアコーディングタスクにおいて、既知のモデルすべての中で最高スコアを獲得したことを示しています。
エージェントのコーディング
推論
エージェント検索とコンピューター利用
注:
SWE-bench Verified、Pro、Multilingual:キャッシュ(記憶化)スクリーニングが一部の問題を除外しています。記憶化の可能性がある問題を除いた後でも、Mythos Preview の Opus 4.6 に対する優位の幅は変わりません。
SWE-bench Multimodal:内部実装を使用しており、公開ランキングとはスコアを直接比較できません。
Terminal-Bench 2.0:Terminus-2 フレームワークを使用し、自適応思考モードにおける最大努力、各タスクの総予算 100 万 token、1 倍保証 / 3 倍上限のリソース割り当て、各タスク 5 回試行の平均を取っています。タイムアウト制限を 4 時間に引き上げ、Terminal-Bench 2.1 で更新した後、Mythos Preview のスコアは 92.1% です。
BrowseComp:Claude Mythos Preview は Opus 4.6 よりスコアが高く、token 消費量は後者の 1/4.9 だけです。
Humanity’s Last Exam:Mythos は低努力モードでも良好に機能し、一定程度のキャッシュ(記憶化)がある可能性があります。
このモデルの能力、安全属性、基本特性の詳細については、Claude Mythos Preview システムカードをご参照ください。
私たちは Claude Mythos Preview を一般公開する計画はありませんが、最終的な目標は、ユーザーが安全に Mythos レベルのモデルを大規模に展開できるようにすることです――それはサイバーセキュリティだけでなく、このような高能力モデルがもたらす他の多くの価値のためにも使われます。そのために、私たちは(ネットワークセキュリティを含む)安全な防護策の開発において進展を遂げ、モデルが最も危険な出力を検出して阻止できる必要があります。私たちは、今後リリース予定の Claude Opus モデルに新しい安全防護措置を投入し、Mythos Preview と同等のリスク水準を持たないモデルでそれらの措置を改良し、補完できるようにする計画です。
Project Glasswing の次の計画
本日のリリースは、長期的な取り組みの開始です。成功には、技術業界の内外からの幅広い参加が必要です。
Project Glasswing のパートナーは、基盤システム内の脆弱性と弱点を発見・修正するために、Claude Mythos Preview へのアクセス権を得ます。これらのシステムは、世界で共有されるサイバー攻撃面の大きな割合を占めています。作業の重点は、ローカルな脆弱性検出、バイナリのブラックボックステスト、エンドポイント強化、システム侵入テストなどが想定されています。
Anthropic は Project Glasswing とその他の参加者に約束する 1 億ドルのモデル利用枠により、研究プレビュー期間中の大部分の利用をカバーします。その後、Claude Mythos Preview は参加者に対し、入力 / 出力 token 100 万あたり 25 ドル / 125 ドルの価格で提供されます(参加者は Claude API、Amazon Bedrock、Google Cloud Vertex AI、Microsoft Foundry を通じて当該モデルにアクセスできます)。
モデル利用枠に加えて、私たちは Linux Foundation を通じて Alpha-Omega および OpenSSF にそれぞれ 250 万ドル、Apache Software Foundation に 150 万ドルを寄付し、オープンソースソフトウェアの保守者がこの変化の状況に対応できるよう支援します(関心のある保守者は Claude for Open Source プランからアクセスを申請できます)。
私たちは、この取り組みのスコープを継続的に拡大し、数か月にわたって続けられるようにし、できるだけ多くの知見を共有して、他の組織もそれらを自社のセキュリティに適用できるようにしたいと考えています。パートナーは、条件が許す範囲で互いに情報とベストプラクティスを共有します。90 日以内に、Anthropic は、私たちの発見と開示可能な修正済みの脆弱性および改善策について公開報告を行います。さらに、私たちは主要なセキュリティ組織と協力し、AI 時代におけるセキュリティ実践の進化に関する一連の実用的な提言を策定します。そこには、脆弱性開示プロセス、ソフトウェア更新プロセス、オープンソースおよびサプライチェーンセキュリティ、ソフトウェア開発ライフサイクルとセキュリティ設計実践、規制対象業界の標準、トリアージの拡張と自動化、そしてパッチ自動化などが含まれる可能性があります。
Anthropic はまた、米国政府の当局者と、Claude Mythos Preview の攻防におけるサイバーセキュリティ能力について継続的に協議しています。重要インフラを守ることは、民主国家にとって最優先の国家安全保障事項です。これらのサイバーセキュリティ能力の登場は、米国および同盟国が AI 技術において決定的なリードを維持しなければならないことを、改めて示しています。政府には、このリードを維持する支援や、AI モデルに関連する国家安全保障リスクの評価と緩和において、欠かせない役割があります。私たちは、あらゆるレベルの政府代表と協力し、これらの任務を支援することを望みます。
私たちは、Project Glasswing が、産業界と公共部門をまたぐより大規模な取り組みを生み出し、強力なモデルがセキュリティに与える影響の最大の問題に対して、関係者が共に対応できるようになることを期待しています。私たちは、他の AI 業界のメンバーにも加わっていただき、業界標準の策定を支援してもらいたいと考えています。中期的には、民間と公共部門の組織を集約できる独立した第三者機関が、これらの大規模なサイバーセキュリティプロジェクトの今後の業務を担う理想的なプラットフォームになる可能性があります。
補足
このプロジェクトは、ガラスの翼蝶(Greta oto)にちなんで名付けられています。この比喩には二つの意味があります。蝶の透明な翅が、それを目に見えないものにし、本文で議論しているようなコードの中に潜む脆弱性のように、存在を隠せるということです。透明な翅はまた、私たちが提唱する透明性の方法のように、危害を避けるのにも役立ちます。
Mythos という語は古代ギリシャ語に由来し、「物語」または「叙事」――文明が世界を理解するために用いる物語体系――を意味します。
これらの安全防護措置の影響を受ける適法な作業に従事するセキュリティ専門家は、近日公開予定のサイバーセキュリティ検証プログラム(Cyber Verification Program)を申請できます。