アリセンモン全モーダル大規模モデル Qwen3.5-Omni がリリースされました

robot
概要作成中

ディープ潮 TechFlow のニュースで、3月30日、金十データによると、アリババのQianwenが全モーダル大規模モデル Qwen3.5-Omni の提供を開始した。Qwen3.5-Omni シリーズには、Plus、Flash、Light の3つのサイズの Instruct バージョンが含まれており、256k の長いコンテキストをサポートする。モデルは10時間を超える音声入力と、400秒を超える 720P(1FPS)の映像・音声入力に対応する。モデルは、大量のテキスト、ビジョン、ならびに 1億時間を超える音声・映像データでネイティブなマルチモーダル事前学習を行っており、このモデルは卓越した全モーダルの認識と生成能力を示した。Qwen3-Omni と比べて、Qwen3.5-Omni は多言語能力が大幅に強化されており、113の言語・方言の音声認識と、36の言語・方言の音声生成に対応できる。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン