AIMPACT メッセージ、5 月 4 日(UTC+8)、Hugging Faceは比較実験を発表し、オープンソースの重みエンコーディングエージェント(Pi + Moonshot AI Kimi K2.6)とClaude Code + Opus 4.7が訓練された特定のモデルのパフォーマンスを評価しました。タスクは、アメリカ合衆国ノースカロライナ州の1866-1967年の会議法をJim Crow分類することです。実験は同じ一行のプロンプトを使用し、エンドツーエンドで約13分かかり、結果はHugging Faceに投稿されました。本文では具体的な性能指標や結論には言及されていません。(出典:InFoQ)
オープンソースの重みエンコーディングエージェントとClaude Codeの訓練分野モデルの比較
AIMPACT メッセージ、5 月 4 日(UTC+8)、Hugging Faceは比較実験を発表し、オープンソースの重みエンコーディングエージェント(Pi + Moonshot AI Kimi K2.6)とClaude Code + Opus 4.7が訓練された特定のモデルのパフォーマンスを評価しました。タスクは、アメリカ合衆国ノースカロライナ州の1866-1967年の会議法をJim Crow分類することです。実験は同じ一行のプロンプトを使用し、エンドツーエンドで約13分かかり、結果はHugging Faceに投稿されました。本文では具体的な性能指標や結論には言及されていません。(出典:InFoQ)