A equipa de seis pessoas do Poetiq Meta-System atingiu a pontuação mais alta no LiveCodeBench Pro. Este plugin API puro melhora recursivamente, extraindo experiências de tarefas sem tocar em pesos ou ajuste fino, podendo melhorar significativamente modelos fracos. Após a integração, KimiK2.6 subiu de 50,0% para 79,9%, o Gemini3.0 Flash aumentou 10 pontos, superando o Gemini3.1 Pro, Claude Opus4.7 e GPT5.2 High. O GPT5.5 High atingiu 93,9% com o plugin, o Gemini3.1 Pro alcançou 90,9%, superando o Gemini3 Deep Think. Empresas podem melhorar a capacidade de raciocínio sem custos elevados de ajuste fino.

MeNews

2026-05-23 20:04:52

Geração de resumo em curso

AIMPACT mensagem, 15 de maio (UTC+8), de acordo com o monitoramento do Beating, por uma equipe inicial de 6 pessoas fundada pelo ex-pesquisador do Google e DeepMind Shumeet Baluja e Ian Fischer, a Poetiq anunciou que seu Meta-System atingiu a melhor pontuação no benchmark de programação LiveCodeBench Pro. Este sistema é um plugin inteligente puramente baseado em acesso API, que melhora automaticamente a experiência de tarefas por meio de autoaperfeiçoamento recursivo. Testes oficiais mostraram que, sem tocar nos pesos do modelo ou realizar ajustes finos, o sistema elevou diretamente a capacidade de código dos principais grandes modelos do mercado. Os resultados indicam que essa solução desacoplada do modelo oferece melhorias especialmente evidentes em modelos de menor capacidade. Após integrar o sistema Poetiq, a precisão do Kimi K2.6 aumentou de 50,0% para 79,9%, uma melhora absoluta de 29,9 pontos percentuais; o desempenho do leve Gemini 3.0 Flash subiu 10 pontos percentuais, superando a versão maior Gemini 3.1 Pro, além de derrotar de forma superior os modelos Claude Opus 4.7 e GPT 5.2 High, considerados "maiores e mais caros" pela Poetiq. No que diz respeito ao limite de desempenho, o GPT 5.5 High, originalmente com 89,6%, atingiu uma nova altura de 93,9% com o suporte do plugin; enquanto a versão básica Gemini 3.1 Pro, combinada com o plugin, obteve 90,9%, ultrapassando o modelo de raciocínio mais avançado da Google, Gemini 3 Deep Think (88,8%), que ainda não disponibilizou API. A equipe Poetiq afirmou que o ajuste fino tradicional limita as melhorias a um único modelo, enquanto essa solução plug-and-play permite às empresas evitar os altos custos de ajuste fino e implantação de modelos completos para melhorar a capacidade de raciocínio. (Fonte: BlockBeats)

Ver original

Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.

13 gostos

Recompensa
13
7
1
Partilhar

Comentar

Adicionar um comentário

On-ChainSoilAfterTheRain

· 7h atrás

GPT5.5 High direto 93,9%, este plugin é ainda mais avançado do que a atualização oficial

Ver originalResponder0

SlothSignal

· 7h atrás

Espera aí, Gemini3.1 Pro com cheat só chega a 90.9, o original não consegue competir com o cheat do 3.0 Flash? Essa comparação é muito irônica.

Ver originalResponder0

ForkItAnyway

· 7h atrás

Autoaperfeiçoamento recursivo + plugin API puro, essa abordagem é muito ousada, sem alterar os pesos consegue fazer o KimiK2.6 passar de 50 para 79,9, as empresas realmente podem economizar uma grande quantia em ajustes finos.

Ver originalResponder0

VolatilityInATeacup

· 7h atrás

Kimi desta vez ganhou de lavada, a subida de 50 para 79,9 é muito mais rápida do que a sua própria evolução

Ver originalResponder0

PaperHandsPro

· 7h atrás

Os cenários de implementação para empresas devem depender bastante deste sistema, sem precisar acumular cartões ou fazer RLHF, a eficiência pode ser aumentada na camada de API.

Ver originalResponder0

Post-RainReflectionsMarket

· 7h atrás

Sem ajustar pesos nem fazer fine-tuning, apenas confiando na extração baseada em experiência e na melhoria recursiva, essa abordagem é bastante inteligente, evitando uma série de problemas de conformidade e custos

Ver originalResponder0

Frictionless

· 7h atrás

Poetiq, seis pessoas criaram esse Meta-System, tem potencial

Ver originalResponder0

Tópicos em destaque
Ver mais
#
TradfiTradingChallenge
320.47K Popularidade
#
PlatinumCardCreatorExclusive
115.97K Popularidade
#
IsraelStrikesIranBTCPlunges
49.03K Popularidade
#
#DailyPolymarketHotspot
1.05M Popularidade
#
GateSquarePizzaDay
649.86K Popularidade

Fixado

Não mexa nos pesos, ajuste puro via API: Poetiq 「plugin」 faz Kimi subir 29,9 pontos percentuais, versão leve do Gemini vira o jogo contra Claude Opus

Tópicos em destaque

TradfiTradingChallenge

PlatinumCardCreatorExclusive

IsraelStrikesIranBTCPlunges

#DailyPolymarketHotspot

GateSquarePizzaDay

Fixado