OpenAI выпустила Открытый исходный код безопасной модели вывода gpt-oss-safeguard, поддерживающую классификацию на основе политик.

2025-10-29 12:40:18

Генерация тезисов в процессе

PANews 29 октября сообщает, что OpenAI сегодня выпустила открытый исходный код модели безопасного вывода gpt-oss-safeguard (120b, 20b), позволяя разработчикам предоставлять пользовательские политики для классификации содержимого во время вывода, а также выводить выводы и цепочки вывода модели. Эта модель основана на открытых весах gpt-oss и настроена с использованием лицензии Apache 2.0, доступна для загрузки на Hugging Face. Внутренние испытания показывают, что она превосходит gpt-5-thinking и gpt-oss по точности при использовании нескольких политик, а также демонстрирует результаты, близкие к Safety Reasoner на внешних наборах данных. Ограничения включают: традиционные классификаторы все еще более эффективны в условиях большого количества высококачественных аннотированных сцен, а время вывода и вычислительная мощность достаточно высоки. ROOST создаст сообщество моделей и выпустит технический отчет.

Посмотреть Оригинал

На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .