Plurai的 barred 框架通过給定任務描述和少量無標註樣本，自動生成合成訓練數據，從而訓練出定制的內容護欄，用於審核 AI 輸出是否違規。以這套數據對 qwen2.5-3b（30億參數）進行微調，在對話策略、agent 輸出校驗和醫療合規等任務上超越 OpenAI 的 oss-safeguard-20b（200億參數）及直接使用的 GPT-4.1。框架將任務拆分為多維度，在邊界地帶生成容易判錯的樣本，並通過“非對稱辯論”環節來確保標籤準確性。評測代碼和數據集已在 GitHub 與 Hugging Face 開源。

CoinNetwork

2026-04-29 10:59:47

Генерація анотацій у процесі

Звіт з CoinWorld: рамкова структура barred, запропонована Plurai, автоматично генерує синтезовані навчальні дані за допомогою заданого опису завдання та невеликої кількості неозначених зразків, для тренування налаштованих охоронних бар’єрів (guardrail), що використовуються для перевірки, чи не порушує AI вивід правила. Використання цієї набору даних для донавчання qwen2.5-3b (30 мільярдів параметрів) у задачах стратегії діалогу, перевірки виходів агентів та медичної відповідності повністю перевищує OpenAI’s oss-safeguard-20b (200 мільярдів параметрів), а також перевищує безпосереднє використання GPT-4.1. Ця рамкова структура розбиває завдання на кілька вимірів, спеціально генеруючи зразки, які легко помилково класифікувати, у прикордонних областях. Після генерації зразки проходять етап «неасиметричного дебатування», щоб забезпечити точність міток. Оцінювальний код та набір даних вже відкриті на GitHub та Hugging Face.

Переглянути оригінал

Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.

Нагородити
подобається
Прокоментувати
Репост
Поділіться

Прокоментувати

Додати коментар

Немає коментарів

Популярні теми
Дізнатися більше
#
WCTCTradingKingPK
364.96K Популярність
#
CryptoMarketsDipSlightly
269.97K Популярність
#
IsraelStrikesIranBTCPlunges
35.97K Популярність
#
#DailyPolymarketHotspot
700.17K Популярність
#
StrategyAccumulates2xMiningRate
139.47M Популярність

Закріпити

карта сайту

Plurai：3 мільярди параметрів у малих моделях перевищують 20 мільярдів спеціалізованих захисних моделей

Популярні теми

WCTCTradingKingPK

CryptoMarketsDipSlightly

IsraelStrikesIranBTCPlunges

#DailyPolymarketHotspot

StrategyAccumulates2xMiningRate

Закріпити