Détection de la divulgation : Cursor propose à Composer l'autoinstallation, utilisant un modèle précédent pour construire automatiquement un environnement RL opérationnel. Le processus en deux étapes : d'abord, laisser l'agent fournir 10 commandes de vérification et leurs sorties ; ensuite, un autre agent sélectionne 3 commandes pour construire l'environnement à partir de zéro, avec un maximum de 5 tentatives, abandon si toutes échouent. Pendant la construction, les dépendances seront complétées, telles que la falsification de bases de données, MinIO, Docker sidecar et images de remplacement. Prenons l'exemple du monorepo celo, après un échec initial, une seconde tentative de construction d'un mock utilisateur pour contourner l'authentification a finalement réussi. Composer 2 Terminal-Bench atteint 61,7 %, supérieur aux 47,9 % de la version 1.5. À l'avenir, faire participer l'ancienne version de Composer à davantage d'étapes d'entraînement.

MarsBitNews

2026-05-07 11:18:00

Création du résumé en cours

Selon la surveillance Beating, Cursor a révélé une astuce d’entraînement pour la série de modèles Composer : utiliser le modèle de la génération précédente pour construire automatiquement un environnement exécutable pour le renforcement de l’apprentissage (RL) de la génération suivante. Lors de l’entraînement de Composer 2, Cursor utilise Composer 1.5 pour effectuer cette tâche, appelée autoinstall. L’entraînement RL nécessite un environnement de code exécutable. Si l’environnement n’est pas bien configuré, le modèle gaspille des tokens à déboguer, sans apprendre quoi que ce soit ; dans le pire des cas, l’environnement ne fonctionne pas du tout, ce qui gaspille toute la puissance de calcul de l’entraînement. autoinstall résout ce problème en deux étapes : la première, un agent lit la documentation et la configuration du code, et propose 10 commandes de validation avec leurs sorties attendues ; la deuxième, un autre agent prend 3 de ces commandes, configure l’environnement à partir de zéro jusqu’à ce qu’elles fonctionnent. La deuxième étape peut être réessayée jusqu’à 5 fois, si toutes échouent, l’environnement est abandonné. Lors de la configuration de l’environnement, l’agent comble activement les dépendances manquantes : falsifie des tables de base de données, crée une configuration MinIO pour remplacer S3, active des conteneurs Docker pour jouer le rôle de services sidecar, voire génère des images de remplacement. L’article utilise l’exemple du projet blockchain celo-org/celo-monorepo pour illustrer tout le processus, où après un échec lors de la première tentative de configuration, le second agent crée lui-même des utilisateurs fictifs pour contourner l’authentification, permettant finalement de faire passer le test. Composer 2 a obtenu un score de 61,7 % sur Terminal-Bench (une référence pour tester la capacité de configuration de l’environnement de développement de modèles), contre 47,9 % pour Composer 1.5, soit une amélioration de près de 14 points de pourcentage. Cursor indique que dans le futur, il prévoit d’impliquer davantage l’ancienne version de Composer dans d’autres étapes de l’entraînement, y compris le prétraitement des données, la gestion de l’exécution et l’optimisation de l’architecture.

Voir l'original

Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.

Récompense
J'aime
Commentaire
Reposter
Partager

Commentaire

Ajouter un commentaire

Aucun commentaire

Sujets populaires
Afficher plus
#
GateSquareMayTradingShare
572.44K Popularité
#
BTCPullback
106.31M Popularité
#
IsraelStrikesIranBTCPlunges
43.84K Popularité
#
CLARITYActStalled
3.28M Popularité
#
CryptoStocksRally
1.42M Popularité

Épingler

Cursor dévoile la méthode d'entraînement « auto-boot » : utiliser l'ancien Composer pour préparer l'environnement du nouveau modèle, Terminal-Bench augmente de 14 points

Sujets populaires

GateSquareMayTradingShare

BTCPullback

IsraelStrikesIranBTCPlunges

CLARITYActStalled

CryptoStocksRally

Épingler