Meituan LongCat-2.0-Preview se lanza silenciosamente: sin anuncio, sin código abierto

robot
Generación de resúmenes en curso

AIMPACT mensaje, 28 de abril (UTC+8), con más detalles: el modelo tiene un total de parámetros que superan los billones, utiliza una arquitectura MoE, soporta una ventana de contexto de aproximadamente 1 millón, y la cantidad de parámetros es básicamente la misma que la de DeepSeek V4 lanzado en la misma fecha. Fuentes informadas afirman que LongCat-2.0-Preview fue entrenado y ejecutado completamente en una infraestructura de computación nacional, utilizando de 50,000 a 60,000 tarjetas aceleradoras nacionales, siendo la tarea de entrenamiento de mayor escala realizada hasta ahora con capacidad de computación nacional. Durante las pruebas, se ofrecía un límite gratuito de 10 millones de tokens por día. (Fuente: BlockBeats)

Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado