Plurai:3 миллиарда параметров малых моделей превосходят 20 миллиардов специализированных моделей с защитными барьерами

robot
Генерация тезисов в процессе

币界网消息,Plurai提出的barred框架通过给定任务描述和少量无标注样本,自动生成合成训练数据,训练出定制的内容护栏(guardrail),用于审核AI输出是否违规。
Используя этот набор данных для дообучения, qwen2.5-3b (30 миллиардов параметров) полностью превосходит OpenAI’s oss-safeguard-20b (200 миллиардов параметров) в задачах диалоговой стратегии, проверки вывода агента и медицинской соответствия, а также превосходит напрямую используемый GPT-4.1.
Этот каркас разбивает задачу на несколько измерений, специально генерируя в пограничных областях образцы, легко допускающие ошибку.
После генерации требуется этап «асимметричных дебатов», чтобы обеспечить точность меток образцов.
Код оценки и датасеты уже опубликованы с открытым исходным кодом на GitHub и Hugging Face.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить