El modelo multimodal completo de Alibaba Qwen3.5-Omni en línea

robot
Generación de resúmenes en curso

Notificación de Deep Tide TechFlow, el 30 de marzo, según informó Jin10 Data, Alibaba Tongyi anunció el lanzamiento del modelo de gran escala Qwen3.5-Omni de modalidad completa. La serie Qwen3.5-Omni incluye versiones Instruct en tres tamaños: Plus, Flash y Light, y admite un contexto largo de 256k. El modelo admite entradas de audio de más de 10 horas y entradas de video y audio de más de 400 segundos en 720P (1FPS). El modelo realiza preentrenamiento multimodal nativo en grandes volúmenes de datos de texto, visión y video/audio que superan los 100 millones de horas, y muestra una excelente capacidad de percepción y generación de modalidad completa. En comparación con Qwen3-Omni, las capacidades multilingües de Qwen3.5-Omni mejoran considerablemente, pudiendo admitir reconocimiento de voz en 113 idiomas y dialectos y generación de voz en 36 idiomas y dialectos.

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado