Anthropicは本日、ある計画を発表しました。それがProject Glasswing(グラスウィング計画)です。この計画を打ち出したのは、Anthropicが新たに超強力なモデルClaude Mythos Previewを学習させたためで、これは実はつい2日前のccソースコード流出で言及されていたモデルそのものです。プロジェクトの参加者には、Amazon AWS、Apple、Broadcom、Cisco、CrowdStrike、Google、JPMorgan、Linux Foundation、Microsoft、NVIDIA、Palo Alto Networks、そしてAnthropic自身の計12機関が含まれており、共同で立ち上げられています。平たく言うと、このモデルが強すぎるため安全テストのモードを採用し、認められた機関の内部利用に限定して対外公開はしない、ということです。どれほど強いかというと、みなさんデータ、コード、推論力を直接見れば、opus 4.6をまるごと凌駕しているのが分かります。コード:推理:検索とコンピュータ利用opusは字義どおり「傑作」を意味し、Mythosは字義どおり「神話」を意味します。AnthropicのCEOおよび共同パートナーの錚々たる大物たちが、この計画の後押しのために次々と登場しています。Anthropicは、Claude Mythos Previewを一般向けに公開するつもりはないと明確に述べています。ただし、長期目標は、同等の能力レベルのモデルをユーザーが安全に利用できるようにすることです。そのために彼らは、まず近日中に登場するClaude Opusモデル上で関連する安全防護メカニズムを開発・検証し、リスクが制御可能な条件下で反復を行い、その後段階的に推し進めていく計画で、すぐにopusの新バージョンを出し、相応の能力を提供する可能性もあります。それではProject Glasswingがいったい何なのか、詳しく見ていきましょうこのモデルは何を見つけたの?----------過去数週間、AnthropicはClaude Mythos Previewを使って、世界の主流なオペレーティングシステム、ブラウザ、その他の重要ソフトウェアをスキャンしていました。結果:それまで一度も発見されたことのなかった数千件のゼロデイ脆弱性を発見し、そのうち大量のものが高危険度に分類されました。いくつかの具体例:OpenBSDに存在する、27年ものの脆弱性。OpenBSDはセキュリティの高さで知られ、ファイアウォールなどの重要な基盤の運用に使われています。この脆弱性により、攻撃者はターゲットマシンへの接続だけで、その遠隔からのクラッシュを引き起こせます。FFmpegに存在する、16年ものの脆弱性。FFmpegは数え切れないほどのソフトで動画の符号化・復号化に使われています。モデルが脆弱性を見つけたコード行は、これまで自動化テストツールによって500万回スキャンされていたのに、発見されなかったものでした。Linuxカーネルにおいて、モデルが自律的に複数の脆弱性を見つけ、それらをつなぎ合わせることで、攻撃者が通常ユーザー権限から、マシン全体を完全に制御できるようになります。以上の脆弱性はすべて、関連するソフトウェアの保守担当者に報告済みで、現在すべて修正されています。その他の脆弱性については、Anthropicが先行して暗号化ハッシュ値を公開しており、修正が完了した後に具体的な詳細を公開する予定です。なぜこのことをやるの?---------Anthropicの判断はこうです。AIモデルがソフトウェアの脆弱性を発見し悪用する能力は、少数のトップクラスの人間の専門家を除くすべての人をすでに上回っている、ということ。この能力の拡散は、「発生するかどうか」ではなく「いつ起きるか」という時間問題です。世界のサイバー犯罪による経済的損失は、毎年およそ5000億ドルと見積もられています。医療システム、エネルギー基盤、政府機関への攻撃は、すでに実質的な被害をもたらしており、さらに民間および軍の基盤に対して継続的な脅威となっています。AIは、こうした攻撃を行うために必要なコスト、ハードル、専門性を大幅に引き下げています。Anthropicの論理はこうです。誰かがまずこの能力を攻撃に使うのを待つのではなく、主導してそれを防御に使うべきだ。計画は具体的にどう進める?--------Project Glasswingは現在、2つのレイヤーを含んでいます。第1のレイヤーは、12の創設共同パートナーです。彼らはClaude Mythos Previewへのアクセス権を得て、自身の中核システムに存在する脆弱性をスキャンし修復するために利用します。重点分野には、ローカル脆弱性の検出、バイナリのブラックボックステスト、エンドポイントセキュリティ、ペネトレーションテストなどが含まれます。第2のレイヤーは、さらに40余りの、重要なソフトウェア基盤を構築または維持している組織です。彼らも同様にモデルへのアクセス権を得て、自社およびオープンソースのシステムをスキャンします。Anthropicはこのために、最大1億ドルのモデル利用枠を提供すると約束しています。研究プレビュー期間が終了した後、Claude Mythos Previewは参加者に商用アクセスを提供し、価格は入力/出力1百万tokenあたり25/125ドルで、Claude API、Amazon Bedrock、Google Cloud Vertex AI、Microsoft Foundry経由での接続をサポートします。さらに、AnthropicはLinux Foundationを通じてAlpha-OmegaとOpenSSFにそれぞれ250万ドル、Apacheソフトウェア財団に150万ドル、合計400万ドルを寄付し、この新しい状況に対応するためのオープンソースソフトウェア保守の支援に充てます。オープンソースソフトウェアの保守担当者は、Claude for Open Sourceプロジェクトを通じてアクセス権を申請できます。**今後の計画**情報共有の面では、共同パートナーは可能な限り情報を相互に共有し、ベストプラクティスを連携していきます。Anthropicは90日以内に、研究進捗レポートを公開すると約束しており、内容には、発見された脆弱性の数、修正済みの問題、開示可能な改善成果が含まれます。政策提言の面では、Anthropicは主要なセキュリティ機関と協力して、以下の方向性について実践的な提言を形成します。脆弱性の開示プロセス、ソフトウェア更新プロセス、オープンソースおよびサプライチェーンのセキュリティ、セキュリティソフトウェア開発ライフサイクル、規制対象業界の標準、脆弱性分類のスケール化と自動化、パッチ自動化。この記事の出どころ:AI寒武纪リスクに関する注意事項および免責条項 市場にはリスクがあります。投資は慎重に行ってください。この記事は個人の投資助言を構成するものではなく、特定のユーザーの特殊な投資目標、財務状況、または必要性も考慮していません。ユーザーは、この記事内のいかなる意見、見解、結論が、自身の特定の状況に適合しているかどうかを検討するべきです。これに基づいて投資する場合、責任はすべてご自身に帰属します。
Anthropicは神話レベルのモデル:Claude Mythosを開発したと発表しました。コードとハッキング能力はopus4.6を凌駕し、一般公開はされません!
Anthropicは本日、ある計画を発表しました。それがProject Glasswing(グラスウィング計画)です。この計画を打ち出したのは、Anthropicが新たに超強力なモデルClaude Mythos Previewを学習させたためで、これは実はつい2日前のccソースコード流出で言及されていたモデルそのものです。
プロジェクトの参加者には、Amazon AWS、Apple、Broadcom、Cisco、CrowdStrike、Google、JPMorgan、Linux Foundation、Microsoft、NVIDIA、Palo Alto Networks、そしてAnthropic自身の計12機関が含まれており、共同で立ち上げられています。
平たく言うと、このモデルが強すぎるため安全テストのモードを採用し、認められた機関の内部利用に限定して対外公開はしない、ということです。どれほど強いかというと、みなさんデータ、コード、推論力を直接見れば、opus 4.6をまるごと凌駕しているのが分かります。
コード:
推理:
検索とコンピュータ利用
opusは字義どおり「傑作」を意味し、Mythosは字義どおり「神話」を意味します。AnthropicのCEOおよび共同パートナーの錚々たる大物たちが、この計画の後押しのために次々と登場しています。
Anthropicは、Claude Mythos Previewを一般向けに公開するつもりはないと明確に述べています。ただし、長期目標は、同等の能力レベルのモデルをユーザーが安全に利用できるようにすることです。そのために彼らは、まず近日中に登場するClaude Opusモデル上で関連する安全防護メカニズムを開発・検証し、リスクが制御可能な条件下で反復を行い、その後段階的に推し進めていく計画で、すぐにopusの新バージョンを出し、相応の能力を提供する可能性もあります。
それではProject Glasswingがいったい何なのか、詳しく見ていきましょう
このモデルは何を見つけたの?
過去数週間、AnthropicはClaude Mythos Previewを使って、世界の主流なオペレーティングシステム、ブラウザ、その他の重要ソフトウェアをスキャンしていました。
結果:それまで一度も発見されたことのなかった数千件のゼロデイ脆弱性を発見し、そのうち大量のものが高危険度に分類されました。
いくつかの具体例:
OpenBSDに存在する、27年ものの脆弱性。OpenBSDはセキュリティの高さで知られ、ファイアウォールなどの重要な基盤の運用に使われています。この脆弱性により、攻撃者はターゲットマシンへの接続だけで、その遠隔からのクラッシュを引き起こせます。
FFmpegに存在する、16年ものの脆弱性。FFmpegは数え切れないほどのソフトで動画の符号化・復号化に使われています。モデルが脆弱性を見つけたコード行は、これまで自動化テストツールによって500万回スキャンされていたのに、発見されなかったものでした。
Linuxカーネルにおいて、モデルが自律的に複数の脆弱性を見つけ、それらをつなぎ合わせることで、攻撃者が通常ユーザー権限から、マシン全体を完全に制御できるようになります。
以上の脆弱性はすべて、関連するソフトウェアの保守担当者に報告済みで、現在すべて修正されています。その他の脆弱性については、Anthropicが先行して暗号化ハッシュ値を公開しており、修正が完了した後に具体的な詳細を公開する予定です。
なぜこのことをやるの?
Anthropicの判断はこうです。AIモデルがソフトウェアの脆弱性を発見し悪用する能力は、少数のトップクラスの人間の専門家を除くすべての人をすでに上回っている、ということ。
この能力の拡散は、「発生するかどうか」ではなく「いつ起きるか」という時間問題です。
世界のサイバー犯罪による経済的損失は、毎年およそ5000億ドルと見積もられています。医療システム、エネルギー基盤、政府機関への攻撃は、すでに実質的な被害をもたらしており、さらに民間および軍の基盤に対して継続的な脅威となっています。
AIは、こうした攻撃を行うために必要なコスト、ハードル、専門性を大幅に引き下げています。
Anthropicの論理はこうです。誰かがまずこの能力を攻撃に使うのを待つのではなく、主導してそれを防御に使うべきだ。
計画は具体的にどう進める?
Project Glasswingは現在、2つのレイヤーを含んでいます。
第1のレイヤーは、12の創設共同パートナーです。彼らはClaude Mythos Previewへのアクセス権を得て、自身の中核システムに存在する脆弱性をスキャンし修復するために利用します。重点分野には、ローカル脆弱性の検出、バイナリのブラックボックステスト、エンドポイントセキュリティ、ペネトレーションテストなどが含まれます。
第2のレイヤーは、さらに40余りの、重要なソフトウェア基盤を構築または維持している組織です。彼らも同様にモデルへのアクセス権を得て、自社およびオープンソースのシステムをスキャンします。
Anthropicはこのために、最大1億ドルのモデル利用枠を提供すると約束しています。研究プレビュー期間が終了した後、Claude Mythos Previewは参加者に商用アクセスを提供し、価格は入力/出力1百万tokenあたり25/125ドルで、Claude API、Amazon Bedrock、Google Cloud Vertex AI、Microsoft Foundry経由での接続をサポートします。
さらに、AnthropicはLinux Foundationを通じてAlpha-OmegaとOpenSSFにそれぞれ250万ドル、Apacheソフトウェア財団に150万ドル、合計400万ドルを寄付し、この新しい状況に対応するためのオープンソースソフトウェア保守の支援に充てます。オープンソースソフトウェアの保守担当者は、Claude for Open Sourceプロジェクトを通じてアクセス権を申請できます。
今後の計画
情報共有の面では、共同パートナーは可能な限り情報を相互に共有し、ベストプラクティスを連携していきます。Anthropicは90日以内に、研究進捗レポートを公開すると約束しており、内容には、発見された脆弱性の数、修正済みの問題、開示可能な改善成果が含まれます。
政策提言の面では、Anthropicは主要なセキュリティ機関と協力して、以下の方向性について実践的な提言を形成します。脆弱性の開示プロセス、ソフトウェア更新プロセス、オープンソースおよびサプライチェーンのセキュリティ、セキュリティソフトウェア開発ライフサイクル、規制対象業界の標準、脆弱性分類のスケール化と自動化、パッチ自動化。
この記事の出どころ:AI寒武纪
リスクに関する注意事項および免責条項