Plurai's estrutura de moldura barred gera automaticamente dados de treino sintéticos a partir de uma descrição de tarefa fornecida e de uma pequena amostra não rotulada, treinando assim um filtro de conteúdo personalizado para verificar se as saídas de IA violam as regras. Usando este conjunto de dados para fazer fine-tuning no qwen2.5-3b (30 bilhões de parâmetros), supera tarefas como estratégia de diálogo, verificação de saída de agente e conformidade médica, em relação ao OpenAI's oss-safeguard-20b (200 bilhões de parâmetros) e ao GPT-4.1 usado diretamente. A estrutura divide a tarefa em múltiplas dimensões, gerando amostras que são fáceis de serem classificadas incorretamente na zona de fronteira, e garante a precisão das etiquetas através de uma fase de “debate assimétrico”. O código de avaliação e os conjuntos de dados já estão abertos no GitHub e Hugging Face.

CoinNetwork

2026-04-29 10:59:47

Geração de resumo em curso

Notícias do site Coinjie, o quadro barred proposto pela Plurai gera automaticamente dados de treino sintéticos a partir de uma descrição de tarefa e de uma pequena amostra não rotulada, treinando uma barreira de conteúdo personalizada (guardrail) para verificar se a saída da IA viola as regras.
Este conjunto de dados ajustado com o qwen2.5-3b (30 bilhões de parâmetros) supera amplamente o oss-safeguard-20b da OpenAI (200 bilhões de parâmetros) em tarefas de estratégia de diálogo, verificação de saída de agentes e conformidade médica, e também supera o GPT-4.1 usado diretamente.
Este quadro divide a tarefa em múltiplas dimensões, gerando especialmente amostras fáceis de serem mal interpretadas na zona de fronteira.
Após a geração, as amostras passam por uma fase de «debate assimétrico» para garantir a precisão das etiquetas.
O código de avaliação e os conjuntos de dados já estão abertos no GitHub e no Hugging Face.

Ver original

Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.

Recompensa
gostar
Comentar
Republicar
Partilhar

Comentar

Adicionar um comentário

Nenhum comentário

Tópicos em destaque
Ver mais
#
WCTCTradingKingPK
367.4K Popularidade
#
CryptoMarketsDipSlightly
272.07K Popularidade
#
IsraelStrikesIranBTCPlunges
36.04K Popularidade
#
#DailyPolymarketHotspot
701.41K Popularidade
#
StrategyAccumulates2xMiningRate
139.47M Popularidade

Fixar

Plurai: modelo pequeno de 3 bilhões de parâmetros supera o modelo especializado de 20 bilhões de parâmetros

Tópicos em destaque

WCTCTradingKingPK

CryptoMarketsDipSlightly

IsraelStrikesIranBTCPlunges

#DailyPolymarketHotspot

StrategyAccumulates2xMiningRate

Fixar