Фьючерсы
Доступ к сотням фьючерсов
CFD
Золото
Одна платформа мировых активов
Опционы
Hot
Торги опционами Vanilla в европейском стиле
Единый счет
Увеличьте эффективность вашего капитала
Демо-торговля
Введение в торговлю фьючерсами
Подготовьтесь к торговле фьючерсами
Фьючерсные события
Получайте награды в событиях
Демо-торговля
Используйте виртуальные средства для торговли без риска
CFD
Деривативы CFD на акции США
Акции США
Доступ к реальным акциям США и ETF
Акции Гонконга
Торгуйте качественными акциями, котирующимися в Гонконге
Корейские акции
SK Hynix
Торгуйте реальными корейскими акциями и инвестируйте в популярные активы
Фьючерсы на акции
Высокое кредитное плечо, круглосуточная торговля
Токенизированные акции
Обеспечено реальными акциями
IPO Access
Откройте полный доступ к глобальным IPO акций
GUSD
Создать GUSD для получения доходности казначейских RWA
Мероприятия, связанные с акциями
Торгуйте популярными акциями и получайте щедрые эирдропы
Запуск
CandyDrop
Собирайте конфеты, чтобы заработать аирдропы
Launchpool
Быстрый стейкинг, заработайте потенциальные новые токены
HODLer Airdrop
Удерживайте GT и получайте огромные аирдропы бесплатно
IPO Access
Откройте полный доступ к глобальным IPO акций
Alpha Points
Торгуйте и получайте аирдропы
Фьючерсные баллы
Зарабатывайте баллы и получайте награды аирдропа
Инвестиции
Simple Earn
Зарабатывайте проценты с помощью неиспользуемых токенов
Автоинвест.
Автоинвестиции на регулярной основе.
Бивалютные инвестиции
Доход от волатильности рынка
Мягкий стейкинг
Получайте вознаграждения с помощью гибкого стейкинга
Криптозаймы
0 Fees
Заложите одну криптовалюту, чтобы занять другую
Центр кредитования
Единый центр кредитования
Рекламные акции
Промоакции
Участвуйте и получайте награды
Реферал
20 USDT
Приглашайте друзей за бонусы
Партнерская программа
Эксклюзивные комиссионные
Gate Booster
Растите влияние и получайте аирдроп
Анонсы
Обновления в реальном времени
Блог Gate
Статьи о криптоиндустрии
VIP-услуги
Огромные скидки на комиссии
Управление активами
Универсальное решение для управления активами
Институциональный
Крипто-решения для бизнеса
Разработчикам (API)
Подключение к экосистеме приложений Gate
Внебиржевые банковские переводы
Ввод и вывод фиатных денег
Брокерская программа
Щедрые механизмы скидок API
AI
Gate AI
Ваш универсальный AI-ассистент для любых задач
Gate AI Bot
Используйте Gate AI прямо в вашем социальном приложении
GateClaw
Gate Синий Лобстер — готов к использованию
Gate for AI Agent
AI-инфраструктура: Gate MCP, Skills и CLI
Gate Skills Hub
Более 10 тыс навыков
От офиса до трейдинга: единая база навыков для эффективного использования ИИ
OpenAI запускает оценку мониторинга цепочки мыслей: чем длиннее CoT, тем прозрачнее, RL не учит модель «скрывать мысли».
Этот пакет используется для оценки способности модели мониторинга обнаруживать аномальное поведение через цепочку мыслей (CoT, внутренний процесс рассуждения, генерируемый моделью перед ответом) модели рассуждений, охватывая 13 оценок и 24 среды.
Оценки делятся на три прототипа: Intervention (вмешательство — может ли модель мониторинга заметить изменение поведения после изменения входных данных модели), Process (процесс — проверка достоверности шагов рассуждения модели), Outcome-property (свойство результата — прогнозирование на основе траектории рассуждения, содержит ли вывод обман вознаграждения или нарушение безопасности).
Ключевые выводы статьи: мониторинг CoT эффективнее, чем мониторинг только конечных действий и выходов модели; чем длиннее CoT, тем выше наблюдаемость; обучение с подкреплением (RL) даже при текущих передовых масштабах существенно не снижает наблюдаемость.
Практическое открытие: для больших моделей с низкой вычислительной мощностью рассуждения можно заменить на меньшие модели с более высокой вычислительной мощностью рассуждения, получая более высокую наблюдаемость при сохранении сопоставимых возможностей, ценой более дорогих вычислительных затрат на рассуждение.
Кроме того, увеличение вычислительной мощности рассуждения слабой модели мониторинга может повысить её эффективность мониторинга сильной модели, а предоставление слабой модели мониторинга доступа к CoT не только повышает наблюдаемость, но и ускоряет эту тенденцию масштабирования.
Системная карта GPT-5.4 Thinking уже использует эти оценки. Результаты показывают, что общая наблюдаемость CoT у GPT-5.4 Thinking немного ниже, чем у GPT-5 Thinking, но снижение не является всеобъемлющим: в сценариях agentic misalignment (отклонение выравнивания агента) она близка к 100%, снижение в основном сосредоточено в конкретных сценариях, таких как запросы о здоровье без доказательств, смещение памяти и невозможные задачи.
После расследования OpenAI пришла к выводу, что частичная регрессия связана с ограничениями самих оценок. Репозиторий одновременно отказался от двух оценок: Anti-Scheming и Memory, поскольку в первой наблюдалось несоответствие между общим мониторингом CoT и оценкой ответов, специфичных для задачи, а во второй точность оценки ответов была недостаточной.
(Источник: BlockBeats)