人民財訊3月30日電、アリ千問は、全モーダル大規模モデル「Qwen3.5-Omni」の提供を開始した。Qwen3.5-Omniシリーズには、Plus、Flash、Lightの3種類のサイズのInstructバージョンが含まれており、256k長の長いコンテキストをサポートし、モデルは10時間を超える音声入力および400秒を超える720P(1FPS)の映像・音声入力に対応している。このモデルは、大量のテキスト、視覚情報、ならびに1億時間を超える音声・映像データに対してネイティブなマルチモーダル事前学習を行っており、優れた全モーダルの認識と生成能力を示した。Qwen3-Omniに比べて、Qwen3.5-Omniは多言語能力が大幅に強化されており、113種類の言語と方言の音声認識および36種類の言語と方言の音声生成に対応できる。
アリセンモン全モーダル大規模モデルQwen3.5-Omniがリリースされました
人民財訊3月30日電、アリ千問は、全モーダル大規模モデル「Qwen3.5-Omni」の提供を開始した。Qwen3.5-Omniシリーズには、Plus、Flash、Lightの3種類のサイズのInstructバージョンが含まれており、256k長の長いコンテキストをサポートし、モデルは10時間を超える音声入力および400秒を超える720P(1FPS)の映像・音声入力に対応している。このモデルは、大量のテキスト、視覚情報、ならびに1億時間を超える音声・映像データに対してネイティブなマルチモーダル事前学習を行っており、優れた全モーダルの認識と生成能力を示した。Qwen3-Omniに比べて、Qwen3.5-Omniは多言語能力が大幅に強化されており、113種類の言語と方言の音声認識および36種類の言語と方言の音声生成に対応できる。