Фьючерсы
Доступ к сотням фьючерсов
CFD
Золото
Одна платформа мировых активов
Опционы
Hot
Торги опционами Vanilla в европейском стиле
Единый счет
Увеличьте эффективность вашего капитала
Демо-торговля
Введение в торговлю фьючерсами
Подготовьтесь к торговле фьючерсами
Фьючерсные события
Получайте награды в событиях
Демо-торговля
Используйте виртуальные средства для торговли без риска
Запуск
CandyDrop
Собирайте конфеты, чтобы заработать аирдропы
Launchpool
Быстрый стейкинг, заработайте потенциальные новые токены
HODLer Airdrop
Удерживайте GT и получайте огромные аирдропы бесплатно
Pre-IPOs
Откройте полный доступ к глобальным IPO акций
Alpha Points
Торгуйте и получайте аирдропы
Фьючерсные баллы
Зарабатывайте баллы и получайте награды аирдропа
Инвестиции
Simple Earn
Зарабатывайте проценты с помощью неиспользуемых токенов
Автоинвест.
Автоинвестиции на регулярной основе.
Бивалютные инвестиции
Доход от волатильности рынка
Мягкий стейкинг
Получайте вознаграждения с помощью гибкого стейкинга
Криптозаймы
0 Fees
Заложите одну криптовалюту, чтобы занять другую
Центр кредитования
Единый центр кредитования
Рекламные акции
AI
Gate AI
Ваш универсальный AI-ассистент для любых задач
Gate AI Bot
Используйте Gate AI прямо в вашем социальном приложении
GateClaw
Gate Синий Лобстер — готов к использованию
Gate for AI Agent
AI-инфраструктура: Gate MCP, Skills и CLI
Gate Skills Hub
Более 10 тыс навыков
От офиса до трейдинга: единая база навыков для эффективного использования ИИ
GateRouter
Умный выбор из более чем 40 моделей ИИ, без дополнительных затрат (0%)
Windsurf использовал RL для обучения небольшой модели, специально предназначенной для поиска ошибок, и в внутренней оценке достиг равенства с Claude Opus 4.6
МЕ Новости, 15 апреля (UTC+8), по данным мониторинга 动察 Beating, материнская компания Windsurf, использующая ИИ-инструменты программирования, Cognition AI, совместно с компанией по обучению ИИ Applied Compute, обучили модель SWE-Check, специально предназначенную для обнаружения ошибок в коде, с помощью обучения с усилением. Эта модель анализирует текущие изменения в коде пользователя (diff), автоматически отмечает возможные введённые ошибки и даёт рекомендации по исправлению. В оценке, проводимой на данных, распределённых так же, как и обучающие, F1-скор SWE-Check достиг уровня Claude Opus 4.6 (разница снизилась с 0.09 до 0); в межраспределённой оценке разница сократилась с 0.49 до 0.29, всё ещё уступая передовым моделям, но уже демонстрируя значительный прогресс. Основные преимущества — скорость и стоимость: скорость работы SWE-Check в десять раз выше, чем у передовых моделей, а стоимость вывода значительно снижена, что позволяет осуществлять мгновенное и бесплатное обнаружение ошибок прямо в IDE, чего не могут обеспечить крупные модели вроде Opus 4.6. В методике обучения есть два важных дизайнерских решения: 1. Линейное вознаграждение (reward linearization): команда стремилась оптимизировать глобальный показатель F-beta, но этот показатель нельзя напрямую разбить на отдельные образцы. Они использовали приближение первого порядка, преобразуя глобальный показатель в функцию награды, которую можно вычислять по образцу, что позволяет эффективно повышать глобальный показатель в процессе обучения. В ранних версиях уровень ложных срабатываний был слишком высоким, команда увеличила β с 1 до 0.5, чтобы подчеркнуть точность. 2. Двухэтапное обучение: первый этап — чистое максимизирование способности обнаружения ошибок без штрафов за задержку; второй этап — введение штрафов за задержку, основанных на статистическом распределении времени, которое требуется реальным пользователям, чтобы переключиться после срабатывания обнаружения. Такой поэтапный подход превосходит одновременную оптимизацию двух целей, так как последний склонен застревать в локальных оптимумах, например, учиться очень быстрому, но поверхностному анализу. Предварительная версия SWE-Check уже запущена в Windsurf Next (горячие клавиши cmd+U), а затем перейдёт в полноценную версию Windsurf. (Источник: BlockBeats)