Je ne suis pas sûr de ce que signifie "comme prévu" - en termes de perte de préentraînement, probablement - mais l'attente doit être que des phénomènes émergents que vous ne pouvez pas prédire à l'avance émergent à une échelle sans précédent. Cela était très vrai pour les modèles de la taille de GPT-4 par rapport aux modèles de la taille de GPT-3.
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
11 J'aime
Récompense
11
9
Reposter
Partager
Commentaire
0/400
DataChief
· 09-07 05:17
La taille, c'est la force
Voir l'originalRépondre0
MEVVictimAlliance
· 09-07 04:27
Le phénomène du cygne noir est irréversible
Voir l'originalRépondre0
OnchainGossiper
· 09-04 09:20
L'innovation est souvent difficile à prévoir.
Voir l'originalRépondre0
gaslight_gasfeez
· 09-04 07:49
Franchir les limites de la connaissance
Voir l'originalRépondre0
ImpermanentSage
· 09-04 07:45
Plus le modèle est grand, plus il est confus.
Voir l'originalRépondre0
OldLeekMaster
· 09-04 07:42
C'est vraiment effrayant que le modèle triche.
Voir l'originalRépondre0
StealthMoon
· 09-04 07:42
La transformation à grande échelle est très importante.
Je ne suis pas sûr de ce que signifie "comme prévu" - en termes de perte de préentraînement, probablement - mais l'attente doit être que des phénomènes émergents que vous ne pouvez pas prédire à l'avance émergent à une échelle sans précédent. Cela était très vrai pour les modèles de la taille de GPT-4 par rapport aux modèles de la taille de GPT-3.