El modelo multimodal completo de Alibaba Qwen3.5-Omni en línea

CycleProphet · 2026-03-30T13:46:45+00:00

Ali Qianwen lanza el modelo multimodal completo Qwen3.5-Omni, que soporta un contexto largo de 256k y entrada de audio de más de 10 horas, demostrando excelentes capacidades de percepción y generación multimodal, mejorando las funciones multilingües, y soportando 113 tipos de reconocimiento de voz y 36 tipos de generación de voz.

CycleProphet

2026-03-30 13:46:45

Generación de resúmenes en curso

Notificación de Deep Tide TechFlow, el 30 de marzo, según informó Jin10 Data, Alibaba Tongyi anunció el lanzamiento del modelo de gran escala Qwen3.5-Omni de modalidad completa. La serie Qwen3.5-Omni incluye versiones Instruct en tres tamaños: Plus, Flash y Light, y admite un contexto largo de 256k. El modelo admite entradas de audio de más de 10 horas y entradas de video y audio de más de 400 segundos en 720P (1FPS). El modelo realiza preentrenamiento multimodal nativo en grandes volúmenes de datos de texto, visión y video/audio que superan los 100 millones de horas, y muestra una excelente capacidad de percepción y generación de modalidad completa. En comparación con Qwen3-Omni, las capacidades multilingües de Qwen3.5-Omni mejoran considerablemente, pudiendo admitir reconocimiento de voz en 113 idiomas y dialectos y generación de voz en 36 idiomas y dialectos.

Ver originales

Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.