わかりやすく解説!王炸Fable 5とMythos 5:それはあなたのために何ができるのか

作者:硅谷Alan Walker

もう会話できるロボットとして扱わないでください。今日、Claudeが発表したものは、一日に五千万行のコードを修正でき、自分でソフトを作り、それを使ってモデリングし、ゲノム研究も行い、Scienceの論文に勝った。専門用語はなく、最も実用的な言葉で、「それが一体何ができるのか、あなたや私にとって何の役に立つのか」を一つずつ説明している。

朝の7時40分、California Avenueはまだ完全に目覚めていない。コーヒーが淹れ終わったところで、スマホを砂糖入れの横に立てた——画面にはクリーム色の図が映り、何十匹もの蝶の標本が「5」の大きな字を形作っている。タイトルは一行だけ: Claude Fable 5 and Claude Mythos 5、その下に一言:「私たちは、安全性が確保され、誰でも使える神話級モデルを作った。」

公式サイトのアナウンスを最初から最後まで二度読み、読むほどに落ち着かなくなる。理由は、モデルのスコアがまた上がったからではなく、その中にある「彼が本当に成し遂げたこと」の一連の事柄が、もはや単なる賢いチャットボックスの範疇を超えているからだ。それはまるで、寝ずに働き続け、休まず、少しずつ何でもこなすデジタル社員を雇ったような感覚だ。この文章では、その社員が一体何を代わりにやってくれるのか、詳しく見ていこう。

30秒で読む · 先に結論

  • 今日、Anthropicは一気に二つを発表した。Fable 5:誰でも使える、史上最強の公開版Claude。Mythos 5:同じ大脳を持つが、制約を緩め、信頼できる少数の機関(サイバー防御、政府、トップ研究機関)にだけ提供。

  • 一日で、チームの二か月分のコードを修正完了;画面だけ見て、攻略法なしでポケモンをクリア;自分で3Dモデリングソフトを作り、それを使ってモデリング;さらにはコードを書いて曲も作ったが、音楽は聴いたことがない。

  • 入力$10、出力$50(百万トークンあたり)、Opusの約二倍。サブスクユーザーは6月22日まで無料で使い放題、期限後はクレジットを消費。

  • 「安全マスク」を着用:ネット攻撃や生化学の高リスク問題に直面した場合、自動的に二番手のOpus 4.8に切り替わり、約5%の会話が重なることもあり、たまに正常な要求を誤って遮断することも。

「神話級」とは何段階?なぜ4月は出せなかったのに、今出せるのか?

この話を理解するには、まず段位表が必要だ。これまで馴染みのあったClaudeは、軽量から重厚へと次のように並んでいる: Haiku(小さくて素早く、簡単な高頻度作業向き)、Sonnet(中核、日常のメイン)、Opus(最高性能、難関を突破)。この三つの層は、数年にわたり使われてきた。今年、AnthropicはOpusの上に、新たにより高次の層を重ねた——それが**Mythos級(神話級)**だ。最強のClaudeよりも一段高い、別の次元の存在だ。これはちょっとしたアップグレードではなく、まったく別の種の進化だ。

このMythosは、今日突然現れたわけではない。実は、今年4月にささやかにプレビュー版が公開された:Mythos Preview。最初のテストで、驚くべきことに自分たちも驚いた——このモデルは**「ソフトウェアの脆弱性を見つけ、ネット攻撃を仕掛ける」**能力が非常に高く、主流のOSやブラウザの安全ホールを次々と見つけ出せるほどだった。この能力は善意の人にとっては命を守る盾だが、悪意のある者にとっては万能の鍵となる。そこで彼らは、一般公開を控え、_Project Glasswing(ガラスの翼計画)_と呼ばれるクローズドなグループだけに提供した。これは、重要インフラを管理する少数の機関——銀行、電力網、医療、大規模ソフトウェア企業——にだけ渡し、Amazon、Apple、Google、Microsoft、JPMorgan Chaseなどの巨頭とともに、自社のセキュリティを強化させるためだった。その後、約150の機関、15か国以上に広がった。

なぜ4月は出せなかったのに、今出せるのか? それは、モデルの性質が変わったのではなく、ガードレール(安全策)が整備されたからだ。この2か月間、Anthropicは「安全ゲート」の構築に集中し、「世界中に公開しても、悪意の者が簡単に抜け出せない」レベルにまで堅牢化した。今日のリリースは二つのメニューからなる:一つはFable 5、全世界向けに安全マスクを着用した状態で公開;もう一つはMythos 5、マスクを一部外し、信頼できる少数の人だけに解放。

4月の時点では、「完成したが公開できない」ことを示唆していたが、今は「安全性が確保できたので、解放できる」状態になった——能力は変わらず、ただ門がしっかり閉じられた、ということだ。

だから、この文章の主なテーマは一つ:この「神話級」猛獣が、どんなことを代行できるのか? それは、「話相手」だけではなく、「一つの完結した仕事」を自分でやりきることができる点にある。これが、従来のAIと根本的に違うところだ。以下の五つの段落で、それを一つずつ見ていく。

FableとMythosの違いは何?同じ人が二つの装備を持つ

これは全体の中で最も誤解されやすいポイントだが、最も覚えておくべきこと:**Fable 5とMythos 5は、根底にあるモデルも、同じ脳も、パラメータも、部品も一つも違わない。**彼らは「低性能版」「高性能版」ではなく、「制約の有無」の違いだけだ。直感に反するが、公式の白書にははっきり書かれている:同じ重みを使い、唯一の違いは、「安全ルールの厳しさ」だ。

例え話をしよう:

ある超一流の総合医がいると想像してみてください。最初のケースでは、彼に会社のIDをつけ、コンプライアンス契約を結ばせて、受付に座らせて、見知らぬ人を迎える——これがFableだ。敏感な質問に直面したら、「申し訳ありませんが詳細はお答えできません。専門の担当者におつなぎします」と答える。二つ目のケースでは、同じ人がIDを外し、内部の研究室に入り、信頼できる同僚たちとだけ深く話す——これがMythosだ。

**注意:**最初から最後まで、彼の中身は変わらず、変わるのは彼に課されたルールと、彼が対話する相手だけだ。同じ頭脳を持ちながら、「誰が使うか」「どんな場面で使うか」によって、二つの製品に見える。

さらに面白いのは、これら二つの名前には、設計者の工夫が込められていることだ。Anthropicは脚注でこう述べている:Fable(寓話)はラテン語のfabulaに由来し、「語られる物語」を意味する。一方、希腊語のmythos(神話)も、実は同じ語源の兄弟だ。要するに、寓話と神話は本質的に同じもの——同じ物語を、聞き手によって変えて語る、ということだ。一般向けには「安全な教訓」を付けて語るのが寓話、祭司や神官向けには飾らずに語るのが神話。

この会社は、命名の哲学にまでその思想を反映させている。最も古典的な方法で、「同じ真実でも、聞き手の立場や役割によって、二つのバージョンに変わる」と伝えているのだ。このことは、8段落目でも再び触れる。

一つのチームの二か月分の仕事を一日で終わらせる、これは何を意味する?

最も衝撃的で、かつ実用的な能力の一つは、「コードを書く・修正する」ことだ。実例を挙げよう。著名な決済会社Stripeだ。彼らは5千万行の古いコードベースを持っている——これはどんな規模か?想像してみてください。十年以上かけて建てられ、無数のテナントが住み、水道や電線が何層にも重なる超老朽化したビルのようなものだ。これを「全面的な配線のアップグレード」するには、標準を古いものから新しいものに変え、どこもミスなく行わなければならない。さもなければ、ビル全体が停電・断水になる危険がある。普通なら、エンジニアチームが2か月以上かけて取り組む作業だ。

ところが、Stripeはこの作業をFable 5に丸投げし、一日で完了させた。デモを作るわけでもなく、二つのファイルを修正するだけでもなく、コードベース全体の大規模な改造を一日でやり遂げたのだ。これが何を意味するか? 以前は「大きすぎて、面倒で、リスクも高い」と思われていた作業が、たった一晩で終わる可能性が出てきた。これは単なる「速度向上」ではなく、二か月分の作業を一日に圧縮した、質的な変化だ。

しかも、速いだけではなく、コストも節約できる。特に、コードの品質を厳しく評価するCognitionの最先端テスト(FrontierCode)では、最高評価を獲得しつつ、「頭脳の燃料」も少なく済む——つまり、同じ難題を解くのに、より少ない計算資源で済む。換言すれば、コストも時間も安くなる。さらに、「中程度の努力」でも、「全力で取り組む」他のモデルを凌駕できる。まるで、全力を出さずとも勝てる名人のようだ。

コードエディタのCursorチームは、「最も強力なモデル」として、長大な難題も難なく解ききる能力を持つと評価している。GitHubは、「複雑で長時間かかるプログラミング作業もこなせる」とし、信頼性と自主性が従来の予想を超えていると語る。Cognitionは、「最先端のプログラミングテストで最高点を獲得し、未見のツールもすぐに使いこなせる」と述べている。

また、"素人でもソフトを作れる"プラットフォーム(Base44)は、「一年前は何十回もプロンプトを調整しながら作ったアプリが、今や一発でできる」と証言。つまり、コードを書けなくても、やりたいことをはっきり伝えれば、完成品を直接渡してくれる。

これらを総合すると、今起きている大きな変化は明白だ:プログラミングのハードルが、「書けるかどうか」から「何を伝えるか」に変わりつつある。 そして、真のエンジニアにとっては、単なるコード入力から解放され、「自分の指揮のもと、動くデジタル工事チーム」を指揮することに変わる。どちらにせよ、この変化は、「ソフトウェアがどう作られるか」の根本を、確実に変えている。

財務報告書の読み取り、契約書の修正、グラフの分析——ホワイトカラーの仕事もできる

「コードを書くのはプログラマーの仕事、私には関係ない」——そう思うかもしれないが、実はこれは普通のホワイトカラーの仕事だ。まず、「知識労働」——資料の読解、分析、結論出し——の範囲だ。ある金融試験(Hebbiaの)では、Fable 5が全モデル中最高点を獲得し、特に次の三つに長けている:大量の資料を読んで推論を行う、複雑なグラフや表を理解する、問題の本質を見抜く。

別の取引会社(IMC)は、「ほぼすべての取引分析問題を正解した」と自信を持つ——事実確認、概念説明、根本原因の特定、取引の採算性の計算、いずれもこなせる。

次に、もっと身近な例:表計算。Pythonやデータツールで有名なAnacondaは、「日常的な表計算ツール」の性能をテストし、結果はOpusを上回り、しかも25〜30%高速だった。深夜までの残業や、複雑な複数シートの相関計算、ちょっとした変更ですぐに崩れるExcelの悪夢も、より速く、安定して処理できる。

さらに、弁護士の仕事をサポートする細かい点も。ある企業は、弁護士に契約修正のコメントを盲検評価させたところ、「彼らの修正は、既存のツールと比べて遜色ないどころか、追い越している」と判明。

今や、画像認識タスクにおいても最強のモデルとなった。密な科学図表から正確に数値を読み取ることもできるし、ウェブページのスクリーンショットから、その背後のソースコードを逆算することも可能だ。

最も直感的な例:クラシックゲーム『ポケモン火紅』をプレイさせると、ゲームの画面だけを見て、マップや攻略情報、補助ツールなしで、自力でクリアできる。以前のClaudeは、多くの補助ツールを使わないと難しかったが、今や「目だけ」でクリアできる。これは、「画像を認識する」だけではなく、「状況を理解し、計画し、連続的に判断できる」ことを示している。

コード、分析、画像認識の硬い指標を比較すると、SWE-bench Proという厳しいソフトウェアエンジニアリングのテストでは、Fable 5は80.3点を獲得し、OpenAIの最強モデルGPT-5.5の58.6点を大きく上回る。さらに、「コードを本番に載せられるか」のテストでは、29.3点に対し、GPT-5.5はわずか5.7点。数字は重要ではなく、重要なのはこの法則だ——長く複雑なタスク、実務に近い仕事ほど、他を圧倒する。会話だけならそれほどでもないが、実務の「真の仕事」を任せると、真価を発揮する。

答えるだけではなく、自らツールを作り、創作もできる

最初の二つは、いわば「補助役」だったが、最後の段落は、私がこの公告を読んで最も背筋が寒くなった部分だ——それは、「問題に答える」だけではなく、「ゼロから何かを作り出す」能力を示している。公式のデモから四つを紹介しよう。

  • 物理式から日食の時刻を導き出す:自らコードを書き、太陽系の動きをシミュレートするプログラムを作成。資料を調べるのではなく、物理法則から出発し、惑星の動きを推定し、その規則を使って日食の時刻を予測する。これは科学者の研究のやり方——モデルを作り、現実を予言する。

  • 『Factorio』をプレイし、ゼロから自動化工場を建設:工場の設計、物流の配置、システムの自動運転を自分で決めて、実行。長い工程の計画とシステム設計の試行錯誤を自分で行い、システムを自律的に動かす工場を作り上げる。

  • CADソフトを自作し、それを使って3Dモデルを作成:ブラウザ上で、3Dプリント可能なモデルを設計。ポイントは、モデルだけではなく、その設計に使ったCADエディタも自作し、その中のAIアシスタントも自作。つまり、工具と完成品を一貫して作り上げる。

  • コードを書いて曲を作ったが、本人は音楽を聴いたことがない:水流の動きをシミュレートしたアニメーションを作り、そのリズムは古典的なEDMのビートに合わせている。曲は、コードだけで「計算」して作り出したもので、本人は一度も音を聴いていない。それでも、音楽の構造を理解し、旋律とリズムを「創作」している。

これらのデモの背後には、「記憶」という重要な能力もある。何百万語もの長大なタスクでも、偏らずに処理し、自分の過去のノートを見返して改善できる。公式は、戦略と記憶力を要するカードゲーム『Slay the Spire』をプレイさせたところ、Opusの三倍の成功率を示した。忘れずに、経験を振り返りながら進める、まるで人間のような学習と改善を行っている。

これら五つの段落をつなげてみると、明らかになるのは、かつてのAIは、「あなたのそばの助手、ツールを渡すだけのインターン」だったのに対し、今や「自分でツールを使い、計画し、完結させ、振り返る」“デジタル請負人”へと進化していることだ。あなたが投げるのは、「一つの問題」から、「一つの仕事」へと変わった。

マスクを外したMythos 5はどれほど凄い? 科学の最前線を書き換え始めている

前述のFableはマスクを着用している状態だが、そのマスクを外したMythos 5は、何ができるのか? この部分は普通のニュースではあまり語られないが、「神話級」という言葉の重みを最も実感させる部分であり、また、Anthropicが最も緊張した理由でもある。これは単なる問題解決者ではなく、実際の科学の最前線で、新たな発見を独立して生み出す存在になりつつある。

  • 新薬の設計を約10倍高速化:Anthropic内部のタンパク質設計(新薬開発の核心)を担う専門家が、Mythos 5を使って一部の工程を約10倍高速化。驚くべきは、全工程を人の手を借りずに、自分で標的を選び、ツールを選び、流れを進め、行き詰まったら自力で回復。通常は科学者が一人でやる作業を、最初から最後まで自動化した。結果、14のタンパク質標的のうち、9つが次の段階に進める候補となった。

  • 新たな仮説を提案し、独立研究所に証明された:安定して新規かつ信頼できる科学的仮説を提案できるモデルは、これが初めてだ。科学者のブラインド評価(誰がAIの提案か知らない状態)では、約80%がAIの仮説を好む。特に、ある大腸菌の新しいメカニズムに関する仮説は、後に別の独立した研究室によって実証された——これは、「ただの妄想」ではなく、実証可能な科学的洞察を生み出す能力を示している。

  • ゲノム研究を自分で行い、『Science』の成果に勝った:一週間以上の時間をかけて、ほぼ監視なしで、138種、数百万の細胞データを整理し、同一役割の細胞を識別する機械学習モデルを自ら設計・訓練。結果は、『Science』に掲載された論文を超える性能を示し、そのモデルは100分の1のサイズだった。高名な研究者の指導を受けたインターン生が、トップジャーナルに勝った例だ。

  • 世界最強のサイバーセキュリティ能力:公式には、「現時点で地球上最も強力なサイバーセキュリティモデル」とされる。ほぼすべての主流システムの脆弱性を発見・悪用できる。これが、最初に閉じ込められた理由だ——同じ能力を持ちながら、防御側には鉄壁の盾、攻撃側には万能の鍵となる。

この段落を理解すれば、なぜ安全マスクが必要なのかがわかる。「薬を設計できるAIは、逆に危険なものも設計できる」「脆弱性を修復できるAIは、逆にシステムを破ることもできる」。 強力すぎて命を救うこともできれば、傷つけることもできる。

だから、Anthropicは、その能力を二つに分けた——一般向けのFableは、最も危険な扉を閉じ、信頼できる少数の人だけにMythosを解放する。これは、ケチだからではなく、やむを得ない選択だ。

そのマスクは、私たちを誤って傷つけることもあるのか? いくらか? いつ自分の番が来るのか?

まず、安全マスクの仕組みを説明しよう。多くの人は、「安全制約」と聞くと、「すぐに拒否される」と思いがちだが、実はこの設計はずっと賢い。Fableの入り口には「検査官」(公式には_分類器_)がいて、三つの高リスクトピックだけを監視している——ネット攻撃、生化学、モデル蒸留(モデルの能力を「コピー」して他のモデルに学習させること)。もし質問がこれらの線を越えたら、すぐに門を閉じるのではなく、静かに二番手のOpus 4.8に回す。例えば、「マメ科植物の毒素の作り方」などの質問には、Fableは黙り、Opus 4.8が安全な回答を返す。システムは、「さっきの質問は転送された」と明示もする。なぜ拒否しないのか? 少し弱めのモデルに回すことで、体験を損なわずに安全性を確保している。

この仕組みは、誤って一般人を傷つけることもあるが、非常に少ない。公式は正直に言う:このマスクは、「誤殺もやむなし」の保守的な運用だ。会話の95%以上は、そのまま安全な状態で通る。実務や研究の専門的な仕事をしている人だけが、たまにこの扉にぶつかることがあるだけだ。安全性についても、公式の外部監査では、1000時間以上のテストを経て、「一般的な越狱(セキュリティ突破)」は一度も成功していない。

最後に、コストと時間の話をしよう。Fable 5とMythos 5は同じ価格設定:入力$10 /百万トークン、出力$50 /百万トークン。トークンは、ざっくり言えば「文字を小さな塊に分割したもの」で、これに基づいて課金される。この価格はOpusの約二倍だが、これは、初期のMythos Previewの半額以下——つまり、より強力になり、しかも安くなっている。今日からAPIで使える。名前は**claude-fable-5**。

なぜこんなにこだわるのか? 公式は何度も「产能(キャパシティ)」という言葉を使う。これは、「このモデルは計算コストが高すぎて、需要が爆発したら対応できなくなる」ことを恐れているからだ。だから、最初は無料で試させ、段階的に制限し、拡張したら本格的に解放する。Mythos 5(解放版)は、一般には販売されず、ネットセキュリティのパートナーや一部の研究機関だけに提供される。資格審査を通じてアクセス権を得る仕組みだ。さらに、すべてのMythosレベルの企業利用は、30日間の会話記録を保存し、安全監視に使う。

これが、私たちに何を意味するのか? 最後に三つの醒めた問いを投げかける。

  1. 「六十日悖論」:2か月前は「危険だから公開できない」と言っていたのに、今は公開されている——これは、モデルの危険性が減ったのではなく、安全策の進展があっただけだ。安全は絶えず改善し続けるもので、一度完璧になることはない。

  2. 「一方で規制を叫びながら、もう一方で拡大を進める」:リリース直前、Anthropicは「最先端AIの自己改良を防ぐための共通ブレーキを設置しよう」と呼びかけていたが、その直後に史上最強の公開モデルを出した。この矛盾は、ビジネスと安全の微妙なバランスを示している。

  3. 「これは安全なのか、それとも権力の集中なのか?」:最強の「解放版」は、政府や大規模機関にしか渡らず、一般の防御者は最先端のサイバー能力を使えない。しかも、30日間のデータ保存は、誰かが「最強の力」を少数に閉じ込めているのでは、という疑念も生まれる。

一つの「王手」の製品の成熟を見極めるには、その強さに興奮しつつも、その代償やリスクに冷静でいることだ。

外のCalifornia Avenueでは、フード付きのエンジニアたちがアイスコーヒーを手に、オフィスへ向かっている。彼らの最初の仕事は、きっとFable 5を自分たちの仕事に組み込むことだろう。あのクリーム色の背景に浮かぶ蝶の「5」は、今も私のスマホ画面に留まっている。

この日を覚えておこう。これは、「自分で一つの仕事を完結できる最先端AI」が、初めて大きな面を外し、私たちの前に姿を現した瞬間だ。一つのバージョンはマスクをつけてあなたに渡し、もう一つはマスクを外して少数にだけ見せる。あなたはどちらの層にいるのか? それは、財布だけではなく、「資格」の問題でもある。私たちの世代は、その境界線の上に立っている。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし