Plurai:3 мільярди параметрів у малих моделях перевищують 20 мільярдів спеціалізованих захисних моделей

robot
Генерація анотацій у процесі

Звіт з CoinWorld: рамкова структура barred, запропонована Plurai, автоматично генерує синтезовані навчальні дані за допомогою заданого опису завдання та невеликої кількості неозначених зразків, для тренування налаштованих охоронних бар’єрів (guardrail), що використовуються для перевірки, чи не порушує AI вивід правила. Використання цієї набору даних для донавчання qwen2.5-3b (30 мільярдів параметрів) у задачах стратегії діалогу, перевірки виходів агентів та медичної відповідності повністю перевищує OpenAI’s oss-safeguard-20b (200 мільярдів параметрів), а також перевищує безпосереднє використання GPT-4.1. Ця рамкова структура розбиває завдання на кілька вимірів, спеціально генеруючи зразки, які легко помилково класифікувати, у прикордонних областях. Після генерації зразки проходять етап «неасиметричного дебатування», щоб забезпечити точність міток. Оцінювальний код та набір даних вже відкриті на GitHub та Hugging Face.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити