Meituan inicia pruebas abiertas de su modelo de gran escala con billones de parámetros, cuyo entrenamiento fue completado íntegramente por un clúster de cómputo nacional.

robot
Generación de resúmenes en curso
AIMPACT Noticias, 24 de abril (UTC+8), según fuentes del sector, el nuevo modelo base de gran escala de Meituan, LongCat-2.0-Preview, ya está abierto para pruebas. Este modelo tiene parámetros totales que superan el billón, situándose entre los modelos de gran escala más avanzados del mundo. Según fuentes cercanas, el nuevo modelo V4 de DeepSeek, lanzado el mismo día, tiene un número total de parámetros y parámetros activos básicamente iguales a los de LongCat-2.0-Preview de Meituan. Además del tamaño de los parámetros, el gran avance del nuevo modelo base de Meituan radica en que todo su proceso de entrenamiento e inferencia se completó utilizando clústeres de cómputo domésticos. Según las fuentes mencionadas, Meituan utilizó entre 50,000 y 60,000 tarjetas de cómputo durante la fase de entrenamiento, lo que constituye la tarea de entrenamiento de modelos de gran escala más grande jamás realizada con cómputo doméstico. (Interface) (Fuente: BlockBeats)
Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Fijado