2月16日除夕の日、阿里巴巴は新世代の大規模モデル「千問Qwen3.5-Plus」をオープンソース化し、その性能はGemini 3 Proに匹敵し、世界最強のオープンソースモデルの座を獲得しました。千問3.5は基盤となるモデルアーキテクチャの全面的な革新を実現しており、今回リリースされたQwen3.5-Plusの総パラメータは3970億、活性化パラメータはわずか170億で、小さなモデルながら大きなモデルを凌駕し、万億パラメータのQwen3-Maxモデルを超える性能を発揮します。デプロイ時のGPUメモリ使用量は60%削減され、推論効率は大幅に向上し、最大推論スループットは19倍に達します。Qwen3.5-PlusのAPI価格は1百万トークンあたり0.8元と非常に低く、Gemini 3 Proの1/18です。従来の千問大規模言語モデルと異なり、千問3.5は純粋なテキストモデルからネイティブなマルチモーダルモデルへの世代的な飛躍を実現しました。千問3は純粋なテキストトークンで事前学習を行いましたが、千問3.5は視覚とテキストを混合したトークンを用いて事前学習を行い、中国語・英語をはじめとする多言語、STEM分野、推論データを大幅に追加し、「目を開いた」大規模モデルにより、より密度の高い世界知識と推論ロジックを学習させました。これにより、パラメータ数の約40%未満で超万億規模のQwen3-Maxのトップパフォーマンスを実現し、推論、プログラミング、エージェントなど多方面のベンチマーク評価で優れた結果を出しています。例えば、千問3.5はMMLU-Pro知識推論テストで87.8点を獲得し、GPT-5.2を上回っています。博士レベルの難問GPQAでは88.4点を獲得し、Claude 4.5を超えました。指示遵守のIFBenchでは76.5点で全モデルの記録を更新し、また、一般的なエージェント評価のBFCL-V4や検索エージェントのBrowsecompなどのベンチマークでも、千問3.5はGemini 3 ProやGPT-5.2を凌駕しています。ネイティブなマルチモーダル訓練により、千問3.5の視覚能力も飛躍的に向上しています。多モーダル推論(MathVison)、汎用ビジュアル質問応答(RealWorldQA)、テキスト認識とファイル理解(CC_OCR)、空間知能(RefCOCO-avg)、動画理解(MLVU)などの権威ある評価において、千問3.5は常に最高性能を記録しています。学科解答、タスク計画、物理空間推論などの課題では、千問3.5は千問専用モデルQwen3-VLよりも優れた性能を示し、空間位置推論や画像を用いた推論能力も大幅に強化され、推論と分析の精度も向上しています。動画理解においては、長さ2時間(1Mトークンのコンテキスト)までの動画を直接入力でき、長時間動画の内容分析や要約生成に適しています。また、視覚理解とコード生成能力をネイティブに融合させ、画像検索や画像生成ツールと組み合わせることで、手描きのスケッチから直接フロントエンドコードに変換したり、スクリーンショットからUIの問題を特定・修正したりできるため、ビジュアルプログラミングが生産性ツールとして真に機能します。千問3.5のネイティブなマルチモーダル訓練は、阿里雲AIインフラ上で効率的に行われました。さまざまな基盤技術革新により、千問3.5はテキスト、画像、動画などの混合データの訓練スループットをほぼ100%に近づけ、純粋なテキストモデルとほぼ同等の訓練効率を実現しています。さらに、FP8やFP32の高精度適用戦略を巧みに設計し、数十兆トークン規模の訓練時にメモリ使用量を約50%削減し、訓練速度も10%向上させ、モデル訓練のコスト削減と効率向上に寄与しています。また、千問3.5はエージェントフレームワークからエージェントアプリケーションへの新たな突破も達成しています。千問3.5はスマートフォンやPCを自律的に操作し、日常のタスクを効率的にこなすことができ、モバイル端末では主要なアプリやコマンドに対応。PCでは複雑なマルチステップ操作やアプリ間のデータ整理、自動化フローの実行なども可能で、操作効率を大きく向上させています。また、千問チームは拡張性の高いエージェントの非同期強化学習フレームワークを構築し、エンドツーエンドでの処理速度を3倍から5倍に高速化し、プラグイン式のインテリジェントエージェントのサポート規模も百万単位に拡大しています。なお、千問アプリやPC版は、いち早くQwen3.5-Plusモデルを採用しています。開発者は魔搭コミュニティやHuggingFaceから新モデルをダウンロードできるほか、阿里雲の百炼を通じてAPIサービスも直接利用可能です。阿里は今後もさまざまなサイズや機能を持つ千問3.5シリーズのモデルをオープンソース化し、性能の高いフラッグシップモデルQwen3.5-Maxも近日リリース予定です。
阿里が新世代の基模千問3.5を発表、世界最強のオープンソース大規模モデルの座に登る
2月16日除夕の日、阿里巴巴は新世代の大規模モデル「千問Qwen3.5-Plus」をオープンソース化し、その性能はGemini 3 Proに匹敵し、世界最強のオープンソースモデルの座を獲得しました。
千問3.5は基盤となるモデルアーキテクチャの全面的な革新を実現しており、今回リリースされたQwen3.5-Plusの総パラメータは3970億、活性化パラメータはわずか170億で、小さなモデルながら大きなモデルを凌駕し、万億パラメータのQwen3-Maxモデルを超える性能を発揮します。デプロイ時のGPUメモリ使用量は60%削減され、推論効率は大幅に向上し、最大推論スループットは19倍に達します。Qwen3.5-PlusのAPI価格は1百万トークンあたり0.8元と非常に低く、Gemini 3 Proの1/18です。
従来の千問大規模言語モデルと異なり、千問3.5は純粋なテキストモデルからネイティブなマルチモーダルモデルへの世代的な飛躍を実現しました。千問3は純粋なテキストトークンで事前学習を行いましたが、千問3.5は視覚とテキストを混合したトークンを用いて事前学習を行い、中国語・英語をはじめとする多言語、STEM分野、推論データを大幅に追加し、「目を開いた」大規模モデルにより、より密度の高い世界知識と推論ロジックを学習させました。これにより、パラメータ数の約40%未満で超万億規模のQwen3-Maxのトップパフォーマンスを実現し、推論、プログラミング、エージェントなど多方面のベンチマーク評価で優れた結果を出しています。例えば、千問3.5はMMLU-Pro知識推論テストで87.8点を獲得し、GPT-5.2を上回っています。博士レベルの難問GPQAでは88.4点を獲得し、Claude 4.5を超えました。指示遵守のIFBenchでは76.5点で全モデルの記録を更新し、また、一般的なエージェント評価のBFCL-V4や検索エージェントのBrowsecompなどのベンチマークでも、千問3.5はGemini 3 ProやGPT-5.2を凌駕しています。
ネイティブなマルチモーダル訓練により、千問3.5の視覚能力も飛躍的に向上しています。多モーダル推論(MathVison)、汎用ビジュアル質問応答(RealWorldQA)、テキスト認識とファイル理解(CC_OCR)、空間知能(RefCOCO-avg)、動画理解(MLVU)などの権威ある評価において、千問3.5は常に最高性能を記録しています。学科解答、タスク計画、物理空間推論などの課題では、千問3.5は千問専用モデルQwen3-VLよりも優れた性能を示し、空間位置推論や画像を用いた推論能力も大幅に強化され、推論と分析の精度も向上しています。動画理解においては、長さ2時間(1Mトークンのコンテキスト)までの動画を直接入力でき、長時間動画の内容分析や要約生成に適しています。また、視覚理解とコード生成能力をネイティブに融合させ、画像検索や画像生成ツールと組み合わせることで、手描きのスケッチから直接フロントエンドコードに変換したり、スクリーンショットからUIの問題を特定・修正したりできるため、ビジュアルプログラミングが生産性ツールとして真に機能します。
千問3.5のネイティブなマルチモーダル訓練は、阿里雲AIインフラ上で効率的に行われました。さまざまな基盤技術革新により、千問3.5はテキスト、画像、動画などの混合データの訓練スループットをほぼ100%に近づけ、純粋なテキストモデルとほぼ同等の訓練効率を実現しています。さらに、FP8やFP32の高精度適用戦略を巧みに設計し、数十兆トークン規模の訓練時にメモリ使用量を約50%削減し、訓練速度も10%向上させ、モデル訓練のコスト削減と効率向上に寄与しています。
また、千問3.5はエージェントフレームワークからエージェントアプリケーションへの新たな突破も達成しています。千問3.5はスマートフォンやPCを自律的に操作し、日常のタスクを効率的にこなすことができ、モバイル端末では主要なアプリやコマンドに対応。PCでは複雑なマルチステップ操作やアプリ間のデータ整理、自動化フローの実行なども可能で、操作効率を大きく向上させています。また、千問チームは拡張性の高いエージェントの非同期強化学習フレームワークを構築し、エンドツーエンドでの処理速度を3倍から5倍に高速化し、プラグイン式のインテリジェントエージェントのサポート規模も百万単位に拡大しています。
なお、千問アプリやPC版は、いち早くQwen3.5-Plusモデルを採用しています。開発者は魔搭コミュニティやHuggingFaceから新モデルをダウンロードできるほか、阿里雲の百炼を通じてAPIサービスも直接利用可能です。阿里は今後もさまざまなサイズや機能を持つ千問3.5シリーズのモデルをオープンソース化し、性能の高いフラッグシップモデルQwen3.5-Maxも近日リリース予定です。