Lofli: Los grandes modelos ingresan en la era posterior al entrenamiento, con la relación de potencia de preentrenamiento y postentrenamiento de los equipos de élite alcanzando 1:1

robot
Generación de resúmenes en curso

Noticias ME News, 24 de abril (UTC+8), según la monitorización de Dongcha Beating, la responsable del equipo de grandes modelos de Xiaomi, Luo Fuli, señaló que la competencia en grandes modelos ha pasado de una era dominada por el preentrenamiento en Chat a una era dominada por agentes en post-entrenamiento (Post-train). El punto clave actual es “cómo escalar el aprendizaje por refuerzo (RL) en los agentes”. Este cambio de paradigma ha llevado directamente a una reestructuración en la asignación de recursos computacionales. Luo Fuli reveló que, en la era de Chat, la proporción de recursos para investigación, preentrenamiento y post-entrenamiento era aproximadamente 3:5:1; mientras que en la era actual de agentes, la proporción razonable de asignación de recursos es 3:1:1, es decir, la inversión en preentrenamiento y post-entrenamiento es prácticamente equivalente, y los equipos de modelos de élite ya han alcanzado una proporción de 1:1 en estas dos áreas. Al mismo tiempo, los requisitos de la arquitectura del sistema también han cambiado drásticamente. La infraestructura de RL en el pasado se centraba principalmente en un “motor de inferencia de modelos” para procesar cálculos de texto puro; ahora, la infraestructura debe centrarse en “agentes”, soportar la programación de clústeres heterogéneos y tolerar la interrupción de agentes en flujos de trabajo complejos debido a diversos factores impredecibles. (Fuente: BlockBeats)

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado