Anthropicは史上最強のAIモデルを開発したが、公開を躊躇している……

robot
概要作成中

オリジナル | Odaily 星球日報(@OdailyChina

著者|Azuma(@azuma_eth

4月8日、Claudeの背後にあるAI開発会社Anthropicは、アマゾン、アップル、ブロードコム、シスコ、CrowdStrike、グーグル、JPモルガン・チェース、Linux基金会、マイクロソフト、NVIDIA、Palo Alto Networksなど複数の大手企業と共同で推進する新たな計画「グラスウィング(Project Glasswing)」を打ち出すと、公式に発表しました。

Anthropicは、これは世界の最も重要なソフトウェアを守ることを目的とした緊急の取り組みであり、関係各者が共同でMythos Preview版を用いて、いま世界が生き残るために依拠しているシステムに潜む潜在的な欠陥を発見し修復することになると述べています。

いわゆるMythosとは、Anthropicが開発中の次世代AIモデルのことであり、人類の歴史上初めて、総パラメータが80億億(1兆)規模を突破したモデルです(それに対し、現在市場で主流のモデルのパラメータ数は、数千億から1兆規模にとどまっています)。訓練コストは驚異的な100億ドルに達しました。 Claudeの現時点で最強のモデルOpus 4.6と比べると、Mythosはソフトウェアのコーディング、学術的推論、サイバーセキュリティなどのテストで得点が大幅に上昇しています。

Mythosに関する噂は先週にはすでに市場で広まっており、その際に市場の多くの人が懸念していたのは――ネットワークセキュリティに特化した能力を持つMythosが、現在の安全な攻防の構図に影響を与えるのではないか? もし悪意をもって悪用されれば、より大規模なセキュリティ事故を招くのではないか?――という点でした。Odailyは当時この件についても報じており、業界のセキュリティ専門家、慢雾の創設者Yu Xu(余弦)とともに、暗号資産業界における安全な攻防への潜在的な影響について議論していました(詳しくは『Odailyインタビュー:余弦:Anthropicの核爆弾級新モデルが漏洩、暗号の安全な攻防にどう影響する?』をご参照ください)。ただし当時、Anthropic側はMythosの存在を公開に認めていなかったため、関連情報はなお限られたものでした。

4月8日、「グラスウィング」計画の発表に伴い、Anthropicはさらに多くのMythos関連の詳細も明らかにしました。Anthropic側が公開した実測事例に基づけば、AnthropicはMythosの能力を誇張しておらず、そのため同社は、ハッカー集団に悪意をもって悪用されることを防ぐために、このモデルを直接公開することさえできなかったのです。代わりに、「グラスウィング」計画を通じて、大手企業にまず試用させ、洗い出しと検証を行って、潜在的な脆弱性を前もって補修する計画です。

Mythosが実力を見せつける:数週間で数千の「ゼロデイ脆弱性」を掘り起こす

Mythosの実力について語る中で、Anthropicは直ちに、このモデルの誕生は厳しい事実が到来したことを意味すると述べています――AIモデルのコーディング能力はすでに非常に高い水準に達しており、ソフトウェアの脆弱性を発見し悪用する点では、最も熟練した人間を除くほぼすべての人を凌駕できてしまうのだと。

Anthropic側の開示によれば、短い数週間のうちに、AnthropicはMythosを使って数千のゼロデイ脆弱性(これまでソフトウェア開発者自身でさえ発見されていなかった欠陥)を特定しました。そのうち多くは深刻度の高い脆弱性で、あらゆる主要なオペレーティングシステムおよび主要なブラウザに及び、さらに一連のその他の重要ソフトウェアにも影響しました。

Anthropicは、いくつかの代表的な事例を挙げています:

  • Mythosは、OpenBSDに存在する27年ものの脆弱性を発見しました。このシステムは「極めて安全」であるとして長く知られ、ファイアウォールなどの重要な基盤インフラに広く使われている一方、この脆弱性により攻撃者はリモートから直接システムをクラッシュさせられる;
  • 多くのソフトウェアで使用される動画処理ライブラリFFmpegの中で、Mythosは16年存在していた脆弱性を見つけました。この問題のあるコードは自動化されたテストによって500万回以上トリガーされていたのに、ずっと未発見のままだった;
  • Mythosはさらに、Linuxカーネル内の複数の脆弱性を自動的に連結し、一般ユーザー権限から完全にサーバーを制御できる段階まで権限昇格させることも可能です。

より憂慮すべきなのは、Anthropicによれば、これらの脆弱性の大半は、Mythosがほとんど人の手助けを受けずに「自律的に発見し、悪用のための経路を構築した」ものである、という点です。これは、AIがすでに一流のハッカーチームに近い自動化された攻防能力を備え始めていることを意味しているのかもしれません。

評価のベンチマークでも、MythosはOpus 4.6に対して段階を隔てた進化を示しています。たとえば、ネットワークセキュリティの脆弱性再現テストではMythosは83.1%で、Opus 4.6は66.6%;また複数のコーディングおよび推論テストでも、Mythosは同様に大きくリードする結果となっています。

おそらく、Mythosの能力があまりにも強力であるため、Anthropicはモデルを直接公開するのではなく、まず「グラスウィング」計画を通じて、インターネット全体を先に「補強」することを選んだのです。

この計画により、Anthropicは参加者にMythos Preview版をあらかじめオープンし、それを用いて基盤システム内の脆弱性や弱点を発見し修復できるようにします――重点はローカル脆弱性の検出、バイナリプログラムのブラックボックステスト、端末セキュリティの強化、ならびにシステムの侵入テストなどのタスクに置かれます。

Anthropicはさらに、参加者に対して合計1億ドルのモデル利用枠を提供することを約束し、研究プレビュー段階全体での利用を支援します。その後、Mythos Preview版は、参加者に向けて「80億入力 / 80億出力tokens」ごとにそれぞれ25ドル / 125ドルの価格で公開されます(参加者はClaude API、Amazon Bedrock、Google Cloud Vertex AI、Microsoft Foundryを通じてもこのモデルにアクセス可能です)。モデル利用枠を除いて、AnthropicはLinux基金会を通じてAlpha-OmegaおよびOpenSSFに250万ドルを寄付し、さらにApacheソフトウェア財団に150万ドルを寄付して、オープンソースのソフトウェア保守者が絶えず変化するセキュリティ環境に対処するのを支援します。

Anthropicは「グラスウィング」の参加範囲を段階的に拡大し、数か月にわたって継続的に推進するとともに、可能な限り経験を共有し、他の組織が自社のセキュリティ構築にその関連経験を応用できるようにします。90日以内に、Anthropicは、修正済みの脆弱性や、開示可能なセキュリティ改善策を含む、段階的な成果を公開報告します。

技術はただ進化し続けるが、過度に心配する必要もない

AIは私たちが慣れ親しんだこの世界を不可逆に変えており、本稿が焦点を当てているサイバーセキュリティ分野もその例外ではありません。脆弱性の発見と悪用のハードルが大幅に下がるにつれて、人々はつい、AIが悪意ある行為者の手にある刃となり、既存のサイバーセキュリティの均衡を脅かすのではないかと懸念してしまいますか?(PS:本物のお金をウォレットシステムやオンチェーンのプロトコルに預ける必要がある暗号資産ユーザーにとっては、この懸念が特に強くなるはずです。)

この問題に対し、Anthropicは「私たちにはなお楽観する理由がある」と考えています。AIモデルが危険なのは、悪人が危害を加える能力をそれらが備えているからですが、同時にAIには、重要なソフトウェアの欠陥を発見し修復し、より安全な新しいソフトウェアを開発する上でも計り知れない価値があります。

今後数年のAIの能力が引き続き急速に進化していくことは予見できますが、新たな攻撃手段が現れれば、それに応じた新しい防御メカニズムも同時に出現するはずです。技術のアップグレードは避けられないものの、だからといってリスクが必然的に制御不能になるわけではありません――防御体系が歩調を合わせて進化し、さらにAIを活用してより強固なセキュリティの防衛線を築ける限りは。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン