3月30日、阿里は新世代の全モーダル大規模モデル「Qwen3.5-Omni」を発表し、音声・動画理解、認識、インタラクションなど215項目のタスクでSOTA(性能最優)を達成し、Gemini-3.1 Proを超えて、現在世界最強クラスの全モーダル大規模モデルの一つとなりました。新モデルは非常に高い音声・動画理解能力とリアルタイムの対話能力を備え、音声・動画コンテンツに対して詳細かつ制御可能な構造化された記述を生成でき、対応する言語と方言は最大113種類にのぼります。さらに、音声・動画のVibe Coding能力も自発的に現れました。現在、阿里云の「百練」プラットフォームでは、Qwen3.5-OmniのPlus、Flash、Lightの3種類のAPIが新たに提供されており、短編動画・ライブ配信プラットフォーム、ゲーム、メディアなどの業界で広く活用されています。一般ユーザーもQwen Chatを無料で体験でき、開発者や企業は阿里云の百練プラットフォームを通じてQwen3.5-Omniモデルを呼び出すことができ、1百万トークンあたりの料金は0.8元未満です。(出典:每日経済新聞)
アリが新世代のマルチモーダル大規模モデルQwen3.5-Omniを発表
3月30日、阿里は新世代の全モーダル大規模モデル「Qwen3.5-Omni」を発表し、音声・動画理解、認識、インタラクションなど215項目のタスクでSOTA(性能最優)を達成し、Gemini-3.1 Proを超えて、現在世界最強クラスの全モーダル大規模モデルの一つとなりました。新モデルは非常に高い音声・動画理解能力とリアルタイムの対話能力を備え、音声・動画コンテンツに対して詳細かつ制御可能な構造化された記述を生成でき、対応する言語と方言は最大113種類にのぼります。さらに、音声・動画のVibe Coding能力も自発的に現れました。
現在、阿里云の「百練」プラットフォームでは、Qwen3.5-OmniのPlus、Flash、Lightの3種類のAPIが新たに提供されており、短編動画・ライブ配信プラットフォーム、ゲーム、メディアなどの業界で広く活用されています。一般ユーザーもQwen Chatを無料で体験でき、開発者や企業は阿里云の百練プラットフォームを通じてQwen3.5-Omniモデルを呼び出すことができ、1百万トークンあたりの料金は0.8元未満です。
(出典:每日経済新聞)