Qwen3.5-Omni, el modelo multimodal de Alibaba Qianwen, ya está disponible

MetaMuskRat · 2026-04-01T19:28:00+00:00

Alibaba Qianwen ha lanzado el nuevo modelo grande Qwen3.5-Omni, que incluye versiones Instruct en tres tamaños, soporta un contexto largo de 256k y entrada enriquecida de audio y video. Este modelo, entrenado en una gran escala multimodal, demuestra una potente capacidad de percepción y generación, además de mejorar el soporte multilingüe, pudiendo reconocer 113 idiomas y dialectos.

MetaMuskRat

2026-04-01 19:28:00

Generación de resúmenes en curso

People Finance News, 30 de marzo: Alibaba Tongyi anunció el lanzamiento del modelo de gran escala Qwen3.5-Omni de modalidad completa. La serie Qwen3.5-Omni incluye versiones Instruct en tres tamaños: Plus, Flash y Light, y admite un contexto largo de 256k; el modelo admite más de 10 horas de entrada de audio y más de 400 segundos de entrada de video y audio 720P (1FPS). El modelo realiza entrenamiento de modalidad nativa a gran escala multimoidal en texto masivo, visión y datos de video y audio de más de 100 millones de horas; el modelo muestra una capacidad destacada de percepción y generación de modalidad completa. En comparación con Qwen3-Omni, las capacidades multilingües de Qwen3.5-Omni se han incrementado notablemente, y puede admitir reconocimiento de voz en 113 idiomas y dialectos, así como generación de voz en 36 idiomas y dialectos.

Ver originales

Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.