ディープ潮 TechFlow のニュースで、3月30日、金十データによると、アリババのQianwenが全モーダル大規模モデル Qwen3.5-Omni の提供を開始した。Qwen3.5-Omni シリーズには、Plus、Flash、Light の3つのサイズの Instruct バージョンが含まれており、256k の長いコンテキストをサポートする。モデルは10時間を超える音声入力と、400秒を超える 720P(1FPS)の映像・音声入力に対応する。モデルは、大量のテキスト、ビジョン、ならびに 1億時間を超える音声・映像データでネイティブなマルチモーダル事前学習を行っており、このモデルは卓越した全モーダルの認識と生成能力を示した。Qwen3-Omni と比べて、Qwen3.5-Omni は多言語能力が大幅に強化されており、113の言語・方言の音声認識と、36の言語・方言の音声生成に対応できる。
アリセンモン全モーダル大規模モデル Qwen3.5-Omni がリリースされました
ディープ潮 TechFlow のニュースで、3月30日、金十データによると、アリババのQianwenが全モーダル大規模モデル Qwen3.5-Omni の提供を開始した。Qwen3.5-Omni シリーズには、Plus、Flash、Light の3つのサイズの Instruct バージョンが含まれており、256k の長いコンテキストをサポートする。モデルは10時間を超える音声入力と、400秒を超える 720P(1FPS)の映像・音声入力に対応する。モデルは、大量のテキスト、ビジョン、ならびに 1億時間を超える音声・映像データでネイティブなマルチモーダル事前学習を行っており、このモデルは卓越した全モーダルの認識と生成能力を示した。Qwen3-Omni と比べて、Qwen3.5-Omni は多言語能力が大幅に強化されており、113の言語・方言の音声認識と、36の言語・方言の音声生成に対応できる。