La capacidad de Agent sigue de cerca a Opus4.6, con un precio de solo el 4%: Arcee lanza Trinity Large Thinking de código abierto

robot
Generación de resúmenes en curso

Según el monitoreo de 1M AI News, la empresa estadounidense de modelos de IA Arcee lanzó Trinity-Large-Thinking, un modelo de razonamiento de código abierto orientado a tareas de agentes durante largos periodos de tiempo. El modelo utiliza una arquitectura de expertos mixtos dispersos (MoE), con 400B de parámetros totales, y solo 13B de parámetros activados. Se pueden descargar pesos abiertos en Hugging Face bajo la licencia Apache 2.0.

A diferencia de su predecesor Trinity-Large-Preview (ajuste fino solo por instrucciones), Trinity-Large-Thinking ejecuta un “pensamiento de razonamiento” antes de responder. También mejoran las llamadas a herramientas en múltiples rondas, la coherencia de contexto de larga duración y la capacidad de seguir instrucciones. El objetivo de diseño central es mantener una salida estable en ciclos de agentes de larga duración.

En PinchBench, el punto de referencia de capacidades de agentes desarrollado por Kilo, obtuvo 91.9 puntos, quedando en segundo lugar, solo superado por los 93.3 de Opus 4.6; en Tau2-Airline, el punto de referencia de tareas de agentes, obtuvo 88.0 puntos, el más alto entre todos los modelos comparados. Sin embargo, su rendimiento en puntos de referencia de razonamiento general es “en general”: GPQA-D con 76.3 puntos, por debajo de Kimi-K2.5 (86.9) y Opus 4.6 (89.2); MMLU-Pro con 83.4 puntos, también colocándose en el último lugar. Según la descripción oficial de Arcee, este modelo es, en «muchas dimensiones, el modelo de código abierto más fuerte fuera de China».

El precio del API de Arcee es de salida $0.90 por millón de tokens. Según Arcee, es aproximadamente un 96% más barato que Opus 4.6. El modelo se lanzó simultáneamente en la plataforma de enrutamiento de modelos de IA OpenRouter, con uso gratuito en OpenClaw durante los primeros 5 días. Desde el lanzamiento de Preview a finales de enero, ya ha servido más de 3.37 trillones de tokens en OpenRouter. Preview es el modelo de código abierto con mayor uso de Estados Unidos y el cuarto a nivel mundial entre los incluidos en OpenClaw; Preview continuará ofreciendo de forma gratuita en OpenRouter.

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado