La technique de déportation de l'état est assez intéressante, même les petits modèles peuvent gérer la recherche à long terme, l'open source de Harness-1 vaut la peine d'être suivie.

Voir l'original
CoinNetwork
Le message de CoinWorld, l'intelligence artificielle de recherche 20B Harness-1 a été open source, avec des chercheurs de l'UIUC, de UC Berkeley et de Chroma.
Ce modèle, grâce à une architecture externe d'état, confie au système environnemental la gestion de la mémoire et de l'organisation lors du processus de recherche, permettant à des modèles non de pointe d'obtenir des performances proches de celles des modèles de pointe dans des tâches de recherche longue distance avec très peu de données d'entraînement.
Harness-1, sur 8 benchmarks de recherche couvrant les pages web, la finance, les brevets et les questions à plusieurs sauts, atteint en moyenne un taux de rappel de filtrage de 0,730, supérieur de 11,4 points de pourcentage à celui du sous-système de recherche open source le plus proche, montrant que la gestion explicite de l'état de recherche aide le modèle à apprendre des stratégies de recherche plus transférables.
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épinglé