ME News Message, le 23 avril (UTC+8), selon la surveillance de Beating, l'équipe de Yu Feng de l'UCSB, en collaboration avec fuzz.land et d'autres institutions, propose AgentFlow, qui synthétise automatiquement des harness multi-agents (programmes orchestrant la répartition des rôles des agents, la transmission d'informations, l'attribution d'outils et la logique de reprise) pour la découverte de vulnérabilités. L'article indique qu'à modèle constant, modifier uniquement le harness peut faire varier le taux de réussite de plusieurs fois, mais les solutions existantes sont principalement rédigées manuellement ou ne recherchent qu'un espace de conception local. AgentFlow utilise un DSL graphique typé pour unifier les cinq dimensions du harness (rôle, topologie, mode de message, liaison d'outils, protocole de coordination) en un programme graphique modifiable, permettant d'ajouter ou de modifier simultanément des agents, la topologie, les prompts et l'ensemble d'outils en une seule étape. La boucle externe identifie les étapes défaillantes à partir de signaux d'exécution tels que la couverture du programme cible et les rapports de sanitizer, remplaçant la rétroaction binaire réussite/échec. Sur TerminalBench-2, avec Claude Opus 4.6, il atteint 84,3 % (75/89), le score le plus élevé de sa catégorie sur ce classement. Sur la base de code Chrome (35 millions de lignes de C/C++), le système synthétise un harness composé de plus de 300 agents, dont les instructions d'agent évoluent automatiquement pour cibler spécifiquement les vulnérabilités de sécurité mémoire en C++, exigeant la validation des crashs avec ASAN/UBSAN, et les multi-agents dédupliquent via des documents partagés et des verrous de fichiers. En utilisant le modèle open source Kimi K2.5 sur 192 GPU H100 pendant 7 jours, 10 vulnérabilités zero-day ont été découvertes, toutes confirmées par le Chrome VRP. 6 ont déjà reçu des numéros CVE, impliquant WebCodecs, Proxy, Network, Codecs, Rendering, avec des types incluant UAF, débordement d'entier et débordement de tas, dont CVE-2026-5280 et CVE-2026-6297 sont des évasions de sandbox de niveau Critique. Le cofondateur de fuzz.land, Chaofan Shou, a déclaré que certaines vulnérabilités ont d'abord été découvertes avec MiniMax M2.5, et que MiniMax M2.5 et Opus 4.6 peuvent également en trouver la plupart. AgentFlow est open source. (Source : BlockBeats)

Voir l'original

Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.

Récompense
J'aime
Commentaire
Reposter
Partager

Commentaire

Ajouter un commentaire

Aucun commentaire

Sujets populaires
Afficher plus
#
SKHynixTopsKOSPIByMarketCap
1,56M Popularité
#
MicronEarningsBeatExpectationsSharesRise
233,48K Popularité
#
IsraelStrikesIranBTCPlunges
64,02K Popularité
#
WorldCup🏴󠁧󠁢󠁳󠁣󠁴󠁿vs🇧🇷
344,34K Popularité
#
USMayPCEInflationRisesTo4.1%HighestIn3Years
159,57K Popularité

Épinglé

AgentFlow a synthétisé 300 agents pour découvrir 10 vulnérabilités zero-day de Chrome, y compris l'évasion du bac à sable.

Sujets populaires

SKHynixTopsKOSPIByMarketCap

MicronEarningsBeatExpectationsSharesRise

IsraelStrikesIranBTCPlunges

WorldCup🏴󠁧󠁢󠁳󠁣󠁴󠁿vs🇧🇷

USMayPCEInflationRisesTo4.1%HighestIn3Years

Épinglé