No estoy seguro de lo que significa "como se esperaba" - en términos de pérdida de preentrenamiento, probablemente - pero la expectativa debería ser que fenómenos emergentes que no puedes predecir de antemano emergen con una escala sin precedentes. Esto fue muy cierto para modelos del tamaño de GPT-4 frente a modelos del tamaño de GPT-3.
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
No estoy seguro de lo que significa "como se esperaba" - en términos de pérdida de preentrenamiento, probablemente - pero la expectativa debería ser que fenómenos emergentes que no puedes predecir de antemano emergen con una escala sin precedentes. Esto fue muy cierto para modelos del tamaño de GPT-4 frente a modelos del tamaño de GPT-3.