Noticia de CoinWorld, Alibaba Qianwen anuncia el lanzamiento del modelo multimodal completo Qwen3.5-Omni. La serie Qwen3.5-Omni incluye versiones Instruct en tres tamaños: Plus, Flash y Light, soportando un contexto de 256k. El modelo admite más de 10 horas de entrada de audio y más de 400 segundos de entrada de audio y video en 720P (1FPS). El modelo ha sido preentrenado de forma nativa en multimodalidad con una gran cantidad de texto, visión y más de 100 millones de horas de datos de audio y video, demostrando capacidades excepcionales de percepción y generación multimodal. En comparación con Qwen3-Omni, la capacidad multilingüe de Qwen3.5-Omni se ha mejorado significativamente, soportando reconocimiento de voz en 113 idiomas y dialectos, y generación de voz en 36 idiomas y dialectos.

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado