RLVR, cette chose, est vraiment un peu à court d'une validation scientifique, quelque chose qui met des dizaines d'années à être falsifié, elle ne peut pas attendre aussi longtemps.

Voir l'original
MeNews
RLVR pourrait être particulièrement mauvais dans le domaine scientifique
ME News Actualités, le 17 mai (UTC+8), RLVR (Renforcement de l'apprentissage et Validation) peut présenter des défauts disproportionnés dans la validation des théories scientifiques. Le cycle de validation des théories scientifiques peut durer plusieurs décennies voire plusieurs siècles, et les théories actuellement considérées comme meilleures produisent en réalité souvent de pires prédictions. Cette contradiction révèle le conflit fondamental entre le paradigme d'apprentissage par renforcement basé sur des retours à court terme et la longévité et complexité de la recherche scientifique, mettant en évidence les limitations structurelles des méthodes d'IA existantes face à des tâches avec des cycles de rétroaction extrêmement longs, comme la découverte scientifique. (Source : AiHot)
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épinglé