🔥SemiAnalysis 実測:GPT-5.5 が最前線に復帰、しかし SWE-bench Pro は Opus 4.7 に追い越される


半導体と AI 分析機関 SemiAnalysis がプログラミングアシスタントの横断評価を公開し、GPT-5.5、Opus 4.7、DeepSeek V4 をカバー。GPT-5.5 はコードネーム「Spud」の新しい事前学習モデルに基づき、OpenAI が半年ぶりに最前線に復帰したプログラミングモデルであり、SemiAnalysis のエンジニアは Codex と Claude Code の間で切り替えを開始。実測結果は次の通り:Claude は新規プロジェクトの計画に長けており、Codex は推論集約型のバグ修正により強い。しかし、記事は明らかにしている、Ope…
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン