AnthropicはAIの自己改善リスクについて警告 - ForkLog:暗号通貨、AI、シンギュラリティ、未来

ии-стартап Anthropic AI# アントロピックはAI自己改善のリスクについて警告

アントロピックのチームメンバーはますます多くの新モデルの開発をAIシステムに委ねている。会社はこれを再帰的自己改善の兆候と見なしている。

内部データによると、現行製品のコードの80%以上はClaudeが書いたものである。さらに、第2四半期にはエンジニア一人あたりのコード量が2024年と比較して8倍に増加した。

出典:アントロピック研究所。アントロピック研究所のマリナ・ファヴァロ所長と共同創設者のジャック・クラークは、十分な計算資源があれば、トレンドは「完全に自律的に後継者を設計・開発できるシステム」へとつながる可能性があると述べた。

「我々はまだ取り返しのつかない点に到達しておらず、再帰的自己改善は避けられないものではない。しかし、多くの研究機関が準備できる前にそれが起こる可能性がある」 — 専門家は強調した。

ベンチマークと指標

4月、Claudeは800以上の修正を行ったとされており、監督エンジニアの評価では、人間がこれを行うには4年かかるとされる。

公開された課題において、Claudeの成功セッションの割合は2026年5月に76%に上昇し、6ヶ月で50ポイント増加した。

出典:アントロピック研究所。アントロピックは、AIが自律的に確実に実行できる課題の長さは約4ヶ月ごとに倍増していると発表した(以前の7ヶ月と比較して)。

2025年5月の高速化学習タスクでは、小型AIモデルClaude Opus 4は平均して約3倍の速度向上を示し、2026年4月のMythos Previewでは約52倍の向上を記録した。

出典:アントロピック研究所。内部テストでは、Mythos PreviewモデルはAI安全性の研究課題を解決する能力を示した。800時間の作業で、エージェントグループは問題の97%を解決し、2人の人間研究者が1週間で対応できたのは23%に過ぎなかった。

新たな課題

コードの作成において成功を収めている一方で、人間は「研究判断」や戦略的目標の設定において優位性を保っている。

アントロピックは、近い将来、開発者の役割はコードの記述からニューラルネットワークの結果の詳細なレビューへと移行すると考えている。人間による検証こそが、新モデルの開発速度を抑制する最大の要因となり得る。

また、同社は、社会的な制度や整合性研究が進むのに追いつくように、先端AIシステムの開発を遅らせたり一時停止したりすることが有益である可能性も認めている。

並行して、スタートアップの代表者は、片側だけの遅延は逆効果になる可能性も指摘した。より慎重でないプレイヤーは遅れを縮めることができるためだ。安全性に関する決定は、グローバルな調整メカニズムなしには、競争や地政学的圧力の下で行わざるを得なくなる。

なお、5月にアントロピックは、Claude Mythosを用いた脆弱性探索プログラム「Project Glasswing」の最初の報告書を公開した。

同月、同社はClaude Opus 4.8をリリースし、さらにClaude Code向けに動的ワークフロー機能を導入した。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし