Nouvelles ME News, le 23 avril (UTC+8), selon le suivi de Beating, l'équipe UCSB Yu Feng, en collaboration avec fuzz.land et d'autres institutions, a proposé AgentFlow, qui synthétise automatiquement des multi-agent harness (programmes orchestrant la répartition des rôles des agents, la transmission d'informations, l'attribution des outils et la logique de réessai) pour la découverte de vulnérabilités.
L'article indique que, à modèle inchangé, la simple modification du harness peut faire varier le taux de réussite de plusieurs fois, mais les solutions existantes sont souvent écrites manuellement ou ne recherchent qu'un espace de conception local.
AgentFlow utilise un DSL graphique typé pour unifier les cinq dimensions du harness (rôles, topologie, modèles de messages, liaison d'outils, protocole de coordination) en un programme graphique modifiable, permettant d'ajouter ou de modifier en une seule étape les agents, la topologie, les prompts et les ensembles d'outils.
La boucle externe localise les points de défaillance à partir des signaux d'exécution tels que la couverture du programme cible et les rapports de sanitizers, remplaçant le retour binaire succès/échec.
Sur TerminalBench-2, avec Claude Opus 4.6, il atteint 84,3 % (75/89), soit le meilleur score de sa catégorie dans ce classement.
Sur la base de code de Chrome (35 millions de lignes de C/C++), le système a synthétisé un harness composé de plus de 300 agents. Les instructions des agents, évoluées automatiquement, ciblent spécifiquement les vulnérabilités de sécurité mémoire en C++, avec l'obligation de valider les crashs via ASAN/UBSAN. Les multiples agents dédupliquent via des documents partagés et des verrous de fichiers.
En utilisant le modèle open source Kimi K2.5 sur 192 GPU H100 pendant 7 jours, 10 vulnérabilités zero-day ont été découvertes, toutes confirmées par le Chrome VRP.
6 ont reçu des identifiants CVE, concernant WebCodecs, Proxy, Network, Codecs, Rendering, avec des types incluant UAF, débordement d'entier et débordement de tas. Parmi eux, CVE-2026-5280 et CVE-2026-6297 sont des évasions de sandbox de niveau Critique.
Le co-fondateur de fuzz.land, Shou Chaofan, a déclaré que certaines vulnérabilités ont d'abord été découvertes avec MiniMax M2.5, et que MiniMax M2.5 et Opus 4.6 peuvent également en trouver la plupart.
AgentFlow est en open source.
(Source : BlockBeats)

Voir l'original

Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.

Récompense
J'aime
Commentaire
Reposter
Partager

Commentaire

Ajouter un commentaire

Aucun commentaire

Sujets populaires
Afficher plus
#
SKHynixTopsKOSPIByMarketCap
1,56M Popularité
#
MicronEarningsBeatExpectationsSharesRise
233,48K Popularité
#
IsraelStrikesIranBTCPlunges
64,02K Popularité
#
WorldCup🏴󠁧󠁢󠁳󠁣󠁴󠁿vs🇧🇷
344,34K Popularité
#
USMayPCEInflationRisesTo4.1%HighestIn3Years
159,57K Popularité

Épinglé

AgentFlow a synthétisé 300 agents pour découvrir 10 vulnérabilités zero-day de Chrome, y compris l'évasion de sandbox.

Sujets populaires

SKHynixTopsKOSPIByMarketCap

MicronEarningsBeatExpectationsSharesRise

IsraelStrikesIranBTCPlunges

WorldCup🏴󠁧󠁢󠁳󠁣󠁴󠁿vs🇧🇷

USMayPCEInflationRisesTo4.1%HighestIn3Years

Épinglé