Ex ingeniero de Seed de ByteDance: una iteración en ByteDance toma medio año, se rumorea que Google solo necesita tres meses.

robot
Generación de resúmenes en curso
ME News, 24 de abril (UTC+8), según el monitoreo de Dongcha Beating, Zhang Chi, exingeniero del equipo Seed de ByteDance y ahora profesor asistente en la Universidad de Pekín, reveló en el podcast "Into Asia" que ByteDance tarda aproximadamente seis meses en completar una ronda de entrenamiento de modelos grandes (preentrenamiento más postentrenamiento), mientras que Google, según rumores, solo necesita tres meses. Él cree que la velocidad de iteración es una de las razones clave por las que las empresas chinas tienen dificultades para ponerse al día. Zhang Chi estuvo en ByteDance aproximadamente un año, en un equipo de matemáticas con un enfoque más investigativo. Según él mismo, la posición de ese grupo "es más para fines de promoción", diferente de los equipos de preentrenamiento y postentrenamiento responsables de la entrega de modelos. Zhang Chi describió la cultura interna de "benchmaxxing" (optimización de puntuaciones en benchmarks) en Seed: los líderes de equipo evalúan el rendimiento según los benchmarks a cargo, y todos se enfocan en aumentar las puntuaciones, "pero esto no se traduce en una buena experiencia en el uso real". Dijo que en el papel, los modelos de las grandes empresas chinas pueden igualar a los modelos de vanguardia de EE. UU., pero en la práctica "no son lo suficientemente buenos". El objetivo de Seed es ser líder mundial, "pero lamentablemente, no creo que hayamos alcanzado ese nivel", e incluso el objetivo de ser el número uno en China "tampoco se ha logrado". A finales de 2024, Seed se consideraba a sí mismo al nivel de GPT-4o, pero luego DeepSeek lanzó su modelo, y el equipo se dio cuenta de que la brecha aún existía. Cuando él se unió, todo el equipo estaba pasando urgentemente al aprendizaje por refuerzo. (Fuente: BlockBeats)
Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Fijado