Laboratório de IA de Stanford lança o quadro de validação geral LLM-as-a-Verifier, atingindo o estado da arte em dois testes de referência

MeNews · 2026-04-10T00:23:19+00:00

O Laboratório de IA de Stanford lançou uma estrutura de verificação chamada "LLM-as-a-Verifier", que alcançou as melhores taxas de precisão atuais em vários testes de referência, de 86,4% e 77,8%, usando múltiplos métodos. O artigo fornece links para blogs relacionados e código.

MeNews

2026-04-10 00:23:19

Geração de resumo em curso

ME News, em 10 de abril (UTC+8), o Laboratório de IA de Stanford (StanfordAILab) lançou recentemente uma estrutura de verificação universal chamada “LLM-as-a-Verifier”. A estrutura alcançou 86,4% de precisão no teste de referência Terminal-Bench 2, através de métodos como a expansão da granularidade de pontuação, a verificação repetida e a decomposição padrão; e alcançou 77,8% de precisão no teste de referência SWE-Bench Verified, atingindo ambos o nível mais elevado atualmente (SOTA). O artigo fornece ligações para o blogue e para o código relacionados. (Fonte: InFoQ)

Ver original

Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.

2 gostos