Alibaba lanza la nueva generación de modelos multimodales Qwen3.5-Omni de Qiwen

robot
Generación de resúmenes en curso

30 de marzo, Alibaba lanzó Qwen3.5-Omni, la nueva generación de modelo de IA multimodal de todo tipo Qianwen, y logró SOTA (el mejor rendimiento) en 215 tareas, como la comprensión, el reconocimiento y la interacción de audio y video, superando a Gemini-3.1 Pro, convirtiéndose en uno de los modelos multimodales de todo tipo más potentes del mundo en la actualidad. El nuevo modelo cuenta con una capacidad extremadamente fuerte para comprender audio y video e interactuar en tiempo real; puede generar descripciones estructuradas detalladas y controlables de los contenidos de audio y video, reconocer hasta 113 idiomas y dialectos, y también, de forma inesperada, hizo emerger la capacidad de “Vibe Coding” para audio y video.

Actualmente, Alibaba Cloud Bailian ha incorporado tres tipos de API para Qwen3.5-Omni: Plus, Flash y Light, que pueden utilizarse ampliamente en industrias como plataformas de video corto/streaming, juegos y creadores independientes. Los usuarios comunes también pueden ir a Qwen Chat para probarlo gratis; los desarrolladores y las empresas pueden llamar al modelo Qwen3.5-Omni a través de la plataforma Alibaba Cloud Bailian, con un costo de menos de 0.8 yuan por cada millón de Tokens (tokens).

(Fuente: Diario de Economía)

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado