CMAの結果 審判のこの一手はかなり厳しい、Fable 5は大胆に分解して修理し、Opus 4.7はまだ縫い合わせて補修中、フィードバックループ > プロンプトエンジニアリングの証明済み

原文表示
CoinNetwork
AIおばさん:独立裁判官を使ってFable 5の6倍のパフォーマンスを発揮
币界网称、Anthropic在对比测试中通过CMA outcomes在独立上下文窗口生成评分智能体作为裁判、依据九项指标评估。
結果显示、独立裁判循环使Fable 5对训练流水线的改进幅度达Opus 4.7的6倍。
Fable 5展现强韧性、敢于大幅架构调整、即使量化回退也坚持修复;
相較之下、Opus 4.7因决策局限而偏向模板微调。
実験結論:可反馈的自我纠错循环与自主记忆管理、比直接写提示词更具实战价值。
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン留め