アリは次世代フラッグシップQwen3.6-Max-Previewのプレビューを公開、インテリジェントエージェントプログラミングを主打

robot
概要作成中
MEニュース 4月20日(UTC+8)、動察Beatingの監測によると、アリ千問チームはQwen3.6-Max-Previewをリリースしました。これは次世代フラッグシップモデルの早期プレビュー版で、既存のQwen3.6-Plusに取って代わります。ユーザーはQwen Studio(chat.qwen.ai)で直接対話体験が可能で、その後阿里雲百炼を通じてqwen3.6-max-previewというモデル名でAPI呼び出しを公開します。インターフェースはOpenAIのチャット完了、レスポンス規格およびAnthropicのプロトコルと互換性があります。
このバージョンは主にエージェントプログラミング(agentic coding)向けで、モデルがプログラマーのように自分でコードを書き、実行し、エラーを見て、ツールを呼び出しながら複数ステップのプログラミングタスクを完了します。
公式は前世代のQwen3.6-Plusと比べて、プログラミングに関して以下のような向上を示しています:SkillsBench +9.9、SciCode +10.8、NL2Repo +5.0、Terminal-Bench 2.0 +3.8ポイント;世界知識とツール呼び出しのフォーマットは、他の三つの項目でそれぞれ2.3から5.3ポイントの向上を示しています。
公式はSWE-bench Pro、Terminal-Bench 2.0、SciCodeなど六つのプログラミングベンチマークで最高得点を獲得したと自称しており、その中のQwenClawBench、QwenWebBenchは命名から千問自作の評価セットと思われ、公開ベンチマークと分けて見る必要があります。
API側には新たにpreserve_thinkingオプションも追加されており、これをオンにするとメッセージは前の数ラウンドのthinking内容を保持します。推論モデルはデフォルトで各ラウンド「本輪思考」だけを返し、多ラウンドのスマートエージェント対話では前の思考が欠落し、モデルが再計画する際に行き詰まったり、既に試したことを忘れたりしやすくなります。このスイッチはその断絶を補うものです。
(出典:BlockBeats)
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし