6月9日、Anthropicは同時に二つの新モデル—Claude Fable 5とClaude Mythos 5をリリースした。興味深いことに、これらは実際には同じ基盤モデルに基づいており、唯一の違いは「安全ガード」の厳しさだけである。これはAnthropicの最も高性能なモデルが初めて公開されたものであり、また稀な「階層化リリース」実験でもある。
この記事は次の理解に役立つ：何がそれを強力にしているのか、なぜ二つの名前があるのか、そして今どう使うべきか。
1. まず、明確にしよう：「Mythosレベル」モデルとは何か？
Claudeに馴染みはあるか？読者は知っているだろう、Anthropicのモデルは常に三つの階層に分かれている：Haiku（高速）、Sonnet（バランス重視）、Opus（最も強力）。今年の4月、Anthropicは静かにOpusの上に新たな階層—Mythosレベル—を導入した。最初のMythosレベルモデル（Claude Mythos Preview）は公開販売されず、「Project Glasswing」というプロジェクトを通じて米国政府と協力してリリースされ、選ばれたサイバーセキュリティ機関や重要インフラ提供者のみが利用可能だった。
理由は簡単：このレベルのモデルはあまりにも強力であり、サイバー攻撃や生物学的研究などの分野で悪用される可能性があるため、Anthropicは直接の公開を控えるべきと考えている。
今回リリースされた二つのモデルは公式のMythosレベルバージョンである：
◆ Claude Fable 5：新しい安全ガードセットを備えた全員利用可能なバージョン；
◆ Claude Mythos 5：一部のガードを解除したバージョンで、Glasswingのような信頼できるパートナーのみが利用可能。両者は同じコアモデルに基づいている。名前も慎重に選ばれている：Fableはラテン語のfabula（「物語」）から由来し、ギリシャ神話のrootsと共有している—同じ起源—ただし「自由に話す能力」の違いだけ。
2. どれくらい強力なのか？
Anthropicによると、Fable 5は同社がこれまで公開したどのモデルよりも優れており、ほぼすべてのAIベンチマークで最先端（SOTA）を達成している。特にソフトウェアエンジニアリング、知識作業、視覚理解、科学研究において卓越している。タスクが長く複雑になるほど、古いモデルに対するリードは大きくなる。
コーディング：二ヶ月分を一日に圧縮。決済会社Stripeは初期テストで、Fable 5が5000万行のRubyコードベースの完全移行を一日で完了したと報告—通常はチームで二ヶ月以上かかる作業だ。Cognition（Devinの開発者）のFrontierCode評価では、Fable 5は最先端モデルの中で最高スコアを記録し、より少ないトークンで済んだ。
視覚：ポケモンFireRedを補助なしでクリア。以前のClaudeモデルは複雑な補助ツール（地図、ナビゲーション、ゲーム状態情報）を必要とし、ポケモンでほとんど進めなかったが、Fable 5は生のゲーム画面を見るだけでクリアできた。ウェブアプリのソースコードもスクリーンショットから直接再構築可能。
記憶：Slay the Spireをプレイしながらメモを取る。数百万トークンのタスクでは、Fable 5は自分のメモを使って集中力を維持し、パフォーマンスを向上させる。カードゲームSlay the Spireのテストでは、持続的な記憶を与えられた後、Opus 4.8に比べて三倍の性能向上を示した。
科学研究：薬物設計を約10倍高速化。Anthropicの内部タンパク質設計の専門家は、Mythos 5を使って薬物開発の一部工程を約十倍速めた—モデルは結合部位の選択、タンパク質設計ツールの実行、失敗からの回復などを人間の助けなしに独立して完了した。14のタンパク質標的のうち、9つが有望な候補薬としてさらなる開発に進んだ。さらに、E. coliタンパク質に関する新しいメカニズム仮説も提案し、後に独立研究所によって確認された。
3. 安全ガードの仕組み：「ダウングレード」トリガーでOpus 4.8へ
これがリリースの最も興味深い側面だ。Fable 5には新しい分類器セット—メインモデルとは別のAIシステム—が搭載されており、潜在的な悪用を検知するよう設計されている。分類器が次の三つの敏感な領域に関するリクエストを検知すると、応答はFable 5からではなく、自動的により弱いモデルのClaude Opus 4.8に切り替わる（ユーザーに通知するプロンプト付き）：
1. サイバーセキュリティ：Mythosレベルのモデルはソフトウェアの脆弱性を発見・悪用する能力が非常に高く、「自律ハッキング」—偵察と横展開を一体化—も可能。これらの能力はサイバー攻撃のコストを大きく下げるため、防御に重点が置かれている。
2. 生物学と化学：モデルは今や実世界の科学的タスク（例：ウイルスカプシドの組み立て予測）も行える。この二重利用能力は悪意ある手に渡ると危険なので、多くのバイオテクノロジーリクエストはOpusにダウングレードされる。
3. 蒸留攻撃：Fable 5の能力を大規模に「抽出」し、競合モデルの訓練に利用されるのを防ぐ。
重要な点：ガードはセッションの5%未満でトリガーされるため、95%以上のユーザーはほぼ全能力を体験できる。Anthropicはこのガードが保守的に調整されており、誤検知もあり得ると認めており、今後誤警報を減らす予定だ。ジャイルブレイクに関しては、外部の脆弱性バウンティテストで1000時間以上行ったが、「ユニバーサルジャイルブレイク」は見つかっていない。
もう一つの注目すべき変更点は、Mythosレベルモデルからのすべてのトラフィックは30日間保持される（エンタープライズクライアントも含む）。これは新たな攻撃手法やジャイルブレイクに対する防御のためであり、Anthropicはこのデータを訓練に使用しないと約束し、アクセス監査などのプライバシー保護も行っている。
4. Mythos 5：ガードなしの「信頼されたサークル」バージョン
Mythos 5は基本的にFable 5から一部のガードを取り除いたもので、世界最強のサイバーセキュリティ能力を持つと主張している。現在は、サイバーセキュリティ機関向けのProject Glasswingを通じてのみ利用可能で、Mythos Previewからのアップグレード版だ。Anthropicは徐々に拡大を計画しており、米国政府と交渉してパートナーを増やし、サイバーセキュリティ組織向けのより体系的な信頼アクセスプログラムを開始し、生物学的研究のための信頼プラン（バイオテクガードは除外し、サイバーセキュリティガードは維持）を展開して新たな治療法を促進する。この「同じモデル、アイデンティティによる階層的解除」アプローチは、フロンティアAIのリリースで初めての試みだ。
5. 価格とアクセス：6月22日まで無料API期間
無料期間中のAPI料金：入力は100万トークンあたり10ドル、出力は50ドル—Mythos Previewの半額以下。モデル識別子はclaude-fable-5で、APIと従量課金のエンタープライズプランは本日から利用可能。加入者は次の点に注意：
◆ 今から6月22日まで：Pro、Max、Team、エンタープライズパッケージにはFable 5が無料で含まれる；
◆ 6月23日以降：パッケージから除外され、継続利用には使用クレジットの購入が必要となる；容量に余裕があれば、無料期間の延長もあり得る；
◆ その後：計算能力の向上に伴い、AnthropicはFable 5を標準サブスクリプションパッケージに再統合する予定だ。つまり、次の二週間は最も強力なモデルを無料で体験できる絶好の機会なので、興味のある読者はこのチャンスを逃さないように。
6. 最終的な考え：「新しいアプローチ」能力と安全性
近年、フロンティア研究所は「モデルが強すぎる場合の対応策」として二つの選択肢—リリース遅延か能力削減—しかなかった。Anthropicは第三の解決策を提案している—公開版には動的なガードを設け、完全版は信頼できる機関に限定して提供する。
このアプローチは完璧ではない：5%の誤検知は一部の専門ユーザー（特にセキュリティ研究者や生物学者）を苛立たせる可能性があり、30日のデータ保持はプライバシーの懸念を引き起こすかもしれない。しかし、これにより「最も強力な能力」が政府プロジェクトの背後にロックされることなく、コントロールされた形で誰もが対話に参加できるようになる。AIが二ヶ月分のチーム作業を一日で完了したり、タンパク質の薬候補を独立して設計したりできるとき、「どうリリースするか」は「何を作るか」と同じくらい重要になる。FableとMythosの共通のルーツは、今後のフロンティアモデルのリリース戦略の先例となるかもしれない。

原文表示