Plurai's cadre de travail barré génère automatiquement des données d'entraînement synthétiques à partir d'une description de tâche donnée et de quelques échantillons non annotés, afin de former des filtres de contenu personnalisés pour vérifier si la sortie de l'IA viole les règles. En utilisant cet ensemble de données pour effectuer un fine-tuning de qwen2.5-3b (30 milliards de paramètres), il dépasse OpenAI's oss-safeguard-20b (200 milliards de paramètres) et GPT-4.1 utilisé directement, dans des tâches telles que la stratégie de dialogue, la vérification des sorties d'agent et la conformité médicale. Le cadre divise la tâche en plusieurs dimensions, génère des échantillons susceptibles d'être mal classés dans la zone frontière, et utilise une étape de "débat asymétrique" pour garantir la précision des étiquettes. Le code d'évaluation et les ensembles de données ont été open-sourcés sur GitHub et Hugging Face.

CoinNetwork

2026-04-29 10:59:47

Création du résumé en cours

CoinWorld消息，Plurai提出的barred框架通过给定任务描述和少量无标注样本，自动生成合成训练数据，训练出定制的内容护栏（guardrail），用于审核AI输出是否违规。使用这套数据微调的qwen2.5-3b（30亿参数）在对话策略、agent输出校验和医疗合规等任务上全面超过OpenAI的oss-safeguard-20b（200亿参数），并且也超过直接使用的GPT-4.1。该框架将任务拆分为多个维度，专门在边界地带生成容易判错的样本。生成后需经过「非对称辩论」环节，确保样本标签的准确性。评估代码和数据集已在GitHub和Hugging Face开源。

Voir l'original

Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.

Récompense
J'aime
Commentaire
Reposter
Partager

Commentaire

Ajouter un commentaire

Aucun commentaire

Sujets populaires
Afficher plus
#
WCTCTradingKingPK
362.77K Popularité
#
CryptoMarketsDipSlightly
267.54K Popularité
#
IsraelStrikesIranBTCPlunges
35.94K Popularité
#
#DailyPolymarketHotspot
698.82K Popularité
#
StrategyAccumulates2xMiningRate
139.47M Popularité

Épingler

Plurai : un petit modèle de 3 milliards de paramètres dépasse le modèle spécialisé de 20 milliards

Sujets populaires

WCTCTradingKingPK

CryptoMarketsDipSlightly

IsraelStrikesIranBTCPlunges

#DailyPolymarketHotspot

StrategyAccumulates2xMiningRate

Épingler