ME News informe que le 23 avril (UTC+8), selon le suivi de Dongcha Beating, l'équipe UCSB Yu Feng, en collaboration avec fuzz.land et d'autres institutions, a proposé AgentFlow, qui synthétise automatiquement des multi-agent harness (programmes orchestrant la répartition des rôles des agents, la transmission d'informations, l'attribution d'outils et la logique de reprise) pour la découverte de vulnérabilités. L'article indique que, à modèle constant, changer uniquement le harness peut faire varier le taux de réussite de plusieurs fois, mais les solutions existantes sont principalement écrites manuellement ou ne recherchent que l'espace de conception local. AgentFlow utilise un DSL de graphe typé pour unifier les cinq dimensions du harness (rôles, topologie, mode de message, liaison d'outils, protocole de coordination) en un programme de graphe éditable, permettant d'ajouter ou de modifier simultanément agents, topologie, prompts et ensembles d'outils en une seule étape. La boucle externe localise les échecs à partir des signaux d'exécution du programme cible (couverture, rapports de sanitizers), remplaçant le feedback binaire réussite/échec. Sur TerminalBench-2, avec Claude Opus 4.6, il atteint 84,3 % (75/89), le meilleur score de ce classement parmi les méthodes similaires. Sur la base de code Chrome (35 millions de lignes de C/C++), le système synthétise un harness composé de plus de 300 agents, dont les instructions d'agents auto-évoluées ciblent spécifiquement les vulnérabilités de sécurité mémoire en C++, exigeant une validation des crashes avec ASAN/UBSAN, et les multi-agents dédupliquent via des documents partagés et des verrous de fichiers. En utilisant le modèle open source Kimi K2.5 sur 192 H100 pendant 7 jours, 10 vulnérabilités zero-day ont été découvertes, toutes confirmées par Chrome VRP. 6 ont obtenu des numéros CVE, impliquant WebCodecs, Proxy, Network, Codecs, Rendering, avec des types incluant UAF, integer overflow et heap buffer overflow, dont CVE-2026-5280 et CVE-2026-6297 sont des sandbox escapes de niveau Critique. Le co-fondateur de fuzz.land, Shou Chaofan, a déclaré que certaines vulnérabilités ont été initialement découvertes avec MiniMax M2.5, et que MiniMax M2.5 et Opus 4.6 peuvent également en découvrir la plupart. AgentFlow a été open-sourcé. (Source : BlockBeats)

Voir l'original

Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.

Récompense
J'aime
Commentaire
Reposter
Partager

Commentaire

Ajouter un commentaire

Aucun commentaire

Sujets populaires
Afficher plus
#
SKHynixTopsKOSPIByMarketCap
1,55M Popularité
#
MicronEarningsBeatExpectationsSharesRise
215,81K Popularité
#
IsraelStrikesIranBTCPlunges
63,94K Popularité
#
WorldCup🏴󠁧󠁢󠁳󠁣󠁴󠁿vs🇧🇷
329,01K Popularité
#
USMayPCEInflationRisesTo4.1%HighestIn3Years
558,54K Popularité

Épinglé

AgentFlow synthétise 300 agents pour découvrir 10 vulnérabilités zero-day de Chrome incluant l'évasion de sandbox.

Sujets populaires

SKHynixTopsKOSPIByMarketCap

MicronEarningsBeatExpectationsSharesRise

IsraelStrikesIranBTCPlunges

WorldCup🏴󠁧󠁢󠁳󠁣󠁴󠁿vs🇧🇷

USMayPCEInflationRisesTo4.1%HighestIn3Years

Épinglé