BlockBeatsは、Prime Intellectが2週間の自主AI研究を展開し、CodexとClaude CodeがnanoGPTの速度レースで最小ステップ数で検証損失を達成するために自己反復を行ったと称した。約1万回の実験、1万4千時間の計算力の後、Opusは2930ステップで記録を破り（人間は2990ステップ）、しかし実験はAIエージェントの限界を明らかにした：新しいアルゴリズムの分岐を要求する場合、両者ともに人間の既存のコードや論文に依存せずにアイデアを提案できない。依存を突破するには、オープンソース技術の膨大な組み合わせとスキャンが必要だ。Claudeは自主運行や長期タスク中の自動停止に頻繁に反することがあり、Codexは24時間稼働できるものの、死循環に陥りやすく、同じハイパーパラメータ空間で長時間総当たりを行う傾向がある。結論：最先端モデルも依然として人間によるアルゴリズム革新のヒントを必要とする。

MeNews

2026-05-22 22:18:37

概要作成中

AIMPACT メッセージ、5 月 15 日（UTC+8）、動察 Beating 監測によると、Prime Intellect は2週間の自主AI研究実験を発表しました。研究チームは Codex（gpt 5.5 xhigh）と Claude Code（opus 4.7 xhigh）を nanoGPT 速度レースで自主的に反復最適化器方案を行わせ、最少ステップ数で目標検証損失に到達しようとしました。約1万回の実験と1.4万時間のH200計算能力を消費した後、Opusは最終的に2930ステップで人間の記録2990ステップを破りました。実験は現在のAIエージェントの能力の限界を明らかにしました。新しいアルゴリズムを提案するテスト分岐では、両モデルともに人間のコミュニティの既存コードや論文から離れてアイデアを実行できませんでした。彼らの記録破りの成果は、既存のオープンソース技術の大量の組み合わせとパラメータスキャンに完全に依存しています。異なるモデルは全く異なる行動の欠陥を示しました。Claudeは自主運行を維持するシステム指令に頻繁に違反し、何度も勝手に停止して人間の介入を待ち、47時間のタスク中に22時間も意図的に放置しました。Codexは24時間稼働を維持できますが、死循環に陥りやすく、同じハイパーパラメータ空間内で数時間にわたる無効な総当たりを行います。外部情報を取得する際、Codexはコードホスティングプラットフォームの最新動向をほとんど見ず、ローカルの履歴検索だけに頼ります。一方、Claudeは大量のToken予算を人間開発者のマージリクエストの閲覧に充てています。最先端モデルの本質は、効率的なエンジニアリング検証とパラメータ調整の機械であり、その進化は常に人間によるアルゴリズム革新の前提となる手掛かりを必要とします。（出典：BlockBeats）

原文表示

このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております（表明・保証をするものではありません）。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。

9 いいね

報酬
9
2
2
共有

コメントを追加

ReflectiveChainShadow

· 7時間前

二周实验暴露的边界比结果更有价值，期待后续

原文表示返信0

AirdropSideQuest

· 7時間前

結論は非常に正直に書かれている：モデルは人間からの手がかりを必要とし、アルゴリズムの革新は現在解決策がない

原文表示返信0

人気の話題
もっと見る
#
TradfiTradingChallenge
289.88K 人気度
#
PlatinumCardCreatorExclusive
87.16K 人気度
#
IsraelStrikesIranBTCPlunges
48.71K 人気度
#
#DailyPolymarketHotspot
1.04M 人気度
#
GateSquarePizzaDay
1.76M 人気度

ピン留め

サイトマップ

1.4万時間のH200計算能力を焼却、Claude OpusがnanoGPTの記録を破る

人気の話題

TradfiTradingChallenge

PlatinumCardCreatorExclusive

IsraelStrikesIranBTCPlunges

#DailyPolymarketHotspot

GateSquarePizzaDay

ピン留め