Plurai's marco de trabajo barred genera automáticamente datos de entrenamiento sintéticos a partir de una descripción de tarea dada y unas pocas muestras sin etiquetar, para entrenar filtros de contenido personalizados que verifican si la salida de IA viola las normas. Con estos datos, se realiza un ajuste fino en qwen2.5-3b (30 mil millones de parámetros), superando a OSS-Safeguard-20b de OpenAI (200 mil millones de parámetros) y a GPT-4.1 utilizado directamente en tareas como estrategia de diálogo, verificación de salida de agentes y cumplimiento médico. El marco divide la tarea en múltiples dimensiones, genera muestras en zonas limítrofes donde es fácil cometer errores y asegura la precisión de las etiquetas mediante una etapa de "debate asimétrico". El código de evaluación y los conjuntos de datos ya están disponibles en código abierto en GitHub y Hugging Face.

CoinNetwork

2026-04-29 10:59:47

Generación de resúmenes en curso

Noticias de Coinjie.com, el marco barred propuesto por Plurai genera automáticamente datos de entrenamiento sintéticos a partir de una descripción de tarea dada y una pequeña muestra sin etiquetar, para entrenar un guardián de contenido personalizado (guardrail) que se utiliza para revisar si la salida de IA viola las normas.
Este modelo ajustado con estos datos, qwen2.5-3b (30 mil millones de parámetros), supera ampliamente a OSS-Safeguard-20b de OpenAI (200 mil millones de parámetros) en tareas como estrategia de diálogo, verificación de salida de agentes y cumplimiento médico, y también supera directamente a GPT-4.1.
Este marco divide la tarea en múltiples dimensiones, generando específicamente muestras fáciles de clasificar en los límites.
Después de la generación, las muestras deben pasar por una etapa de «debate asimétrico» para garantizar la precisión de las etiquetas.
El código de evaluación y los conjuntos de datos ya están abiertos en GitHub y Hugging Face.

Ver original

Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.

Recompensa
Me gusta
Comentar
Republicar
Compartir

Comentar

Añadir un comentario

Sin comentarios

Temas de actualidad
Ver más
#
WCTCTradingKingPK
367.4K Popularidad
#
CryptoMarketsDipSlightly
272.07K Popularidad
#
IsraelStrikesIranBTCPlunges
36.04K Popularidad
#
#DailyPolymarketHotspot
701.41K Popularidad
#
StrategyAccumulates2xMiningRate
139.47M Popularidad

Anclado

Plurai: modelo pequeño de 3 mil millones de parámetros supera al modelo especializado de 20 mil millones

Temas de actualidad

WCTCTradingKingPK

CryptoMarketsDipSlightly

IsraelStrikesIranBTCPlunges

#DailyPolymarketHotspot

StrategyAccumulates2xMiningRate

Anclado