Фьючерсы
Доступ к сотням фьючерсов
CFD
Золото
Одна платформа мировых активов
Опционы
Hot
Торги опционами Vanilla в европейском стиле
Единый счет
Увеличьте эффективность вашего капитала
Демо-торговля
Введение в торговлю фьючерсами
Подготовьтесь к торговле фьючерсами
Фьючерсные события
Получайте награды в событиях
Демо-торговля
Используйте виртуальные средства для торговли без риска
CFD
Деривативы CFD на акции США
Акции США
Доступ к реальным акциям США и ETF
Акции Гонконга
Торгуйте качественными акциями, котирующимися в Гонконге
Фьючерсы на акции
Высокое кредитное плечо, круглосуточная торговля
Токенизированные акции
Обеспечено реальными акциями
IPO Access
Откройте полный доступ к глобальным IPO акций
GUSD
Создать GUSD для получения доходности казначейских RWA
Мероприятия, связанные с акциями
Торгуйте популярными акциями и получайте щедрые эирдропы
Запуск
CandyDrop
Собирайте конфеты, чтобы заработать аирдропы
Launchpool
Быстрый стейкинг, заработайте потенциальные новые токены
HODLer Airdrop
Удерживайте GT и получайте огромные аирдропы бесплатно
IPO Access
Откройте полный доступ к глобальным IPO акций
Alpha Points
Торгуйте и получайте аирдропы
Фьючерсные баллы
Зарабатывайте баллы и получайте награды аирдропа
Инвестиции
Simple Earn
Зарабатывайте проценты с помощью неиспользуемых токенов
Автоинвест.
Автоинвестиции на регулярной основе.
Бивалютные инвестиции
Доход от волатильности рынка
Мягкий стейкинг
Получайте вознаграждения с помощью гибкого стейкинга
Криптозаймы
0 Fees
Заложите одну криптовалюту, чтобы занять другую
Центр кредитования
Единый центр кредитования
Рекламные акции
Промоакции
Участвуйте и получайте награды
Реферал
20 USDT
Приглашайте друзей за бонусы
Партнерская программа
Эксклюзивные комиссионные
Gate Booster
Растите влияние и получайте аирдроп
Анонсы
Обновления в реальном времени
Блог Gate
Статьи о криптоиндустрии
VIP-услуги
Огромные скидки на комиссии
Управление активами
Универсальное решение для управления активами
Институциональный
Крипто-решения для бизнеса
Разработчикам (API)
Подключение к экосистеме приложений Gate
Внебиржевые банковские переводы
Ввод и вывод фиатных денег
Брокерская программа
Щедрые механизмы скидок API
AI
Gate AI
Ваш универсальный AI-ассистент для любых задач
Gate AI Bot
Используйте Gate AI прямо в вашем социальном приложении
GateClaw
Gate Синий Лобстер — готов к использованию
Gate for AI Agent
AI-инфраструктура: Gate MCP, Skills и CLI
Gate Skills Hub
Более 10 тыс навыков
От офиса до трейдинга: единая база навыков для эффективного использования ИИ
Последние исследования DGrid AI затрагивают основную проблему в децентрализованном оценивании ИИ
DGrid AI представляет новую систему Proof of Quality, разработанную для оценки результатов ИИ и улучшения распределения вознаграждений в децентрализованных сетях.
Резюме
Децентрализованные сети ИИ имеют проблему с оплатой, которую исследователи тихо решали уже много лет, и недавняя статья от DGrid AI прямо ставит этот вопрос на повестку дня. Системы оценки качества, обеспечивающие вознаграждение узлов, в основном зависели от наличия правильного ответа для сравнения. На практике такой ответ редко существует.
Статья, четвертая в серии исследований DGrid по Proof of Quality (PoQ), предлагает обученную альтернативу и публикует результаты. PoQ использует небольшие модели оценщиков для оценки качества каждого вывода, и эти оценки определяют вознаграждения. Дешево и масштабируемо.
DGrid построила это поэтапно: версию с учетом задержек, которая включает задержку в расчет выплат, слой устойчивости к обману, который держится, когда оценщики лгут или ленятся, и структуру, которая разбивает “качество” на части для проверки. Надежная инженерия. И каждый слой сталкивался с одной и той же проблемой.
Как развивалась проблема оценки
Основная структура децентрализованной сети вывода создает проблему измерения. Независимые узлы запускают языковые модели и отвечают на запросы пользователей. Эти ответы нужно оценивать, потому что оценки определяют оплату. Криптографическая проверка каждого вычисления была бы технически безупречной, но слишком дорогой в масштабах, поэтому практическим решением стало автоматизированное качество оценки с помощью меньших моделей.
Ранее работы DGrid постепенно развивали этот подход, добавляя выплаты с учетом задержек, защиту от манипулятивных оценщиков и более детальное разбиение понятия “качество” в контексте оценки. Что полностью решить не удалось — так это сам сигнал оценки.
Самым сильным сигналом у команды была семантическая схожесть: сравнить вывод модели с известным правильным ответом и измерить расстояние между ними в пространстве встраивания. Это работает в тестовых средах, где есть эталонные ответы. В реальной сети, где пользователи задают открытые вопросы, а правильных ответов в базе данных нет, это не работает.
Готовые альтернативы показали худшие результаты. Cross-encoder для оценки логического следования между предложениями дал коэффициент корреляции Пирсона −0.363 при оценке качества ответов без эталонного ответа. Отрицательная корреляция означает, что модель скорее предпочитает плохие ответы хорошим. Это непригодный инструмент оценки.
Что предлагает статья
Вместо адаптации существующих моделей исследователи обучили трех судей специально для оценки качества без ссылочных данных. Каждый принимает вопрос и ответ как входные данные и выдает оценку от 0 до 10, без предоставления правильного ответа.
Три модели отличаются по размеру и скорости:
Обучение проходило в два этапа. Сначала модели предварительно обучались на UltraFeedback — публичном наборе данных с ответами, оцененными GPT-4, — затем дообучались на собственной задаче сети. Цель — дать судьям общее понимание качества, прежде чем сосредоточиться на конкретной задаче оценки.
Основной результат
На отложенном тестовом наборе из 300 примеров судья DeBERTa достиг коэффициента корреляции Пирсона 0.747 с прокси-метрикой — без доступа к эталонному ответу. Оценщики с ссылками на правильные ответы из предыдущей системы достигали максимум 0.647.
Объяснение простое: старые оценщики измеряли косинусное расстояние к эталонному встраиванию. Новые судьи оптимизированы полностью под задачу оценки. Разница в эффективности отражает именно это, а не архитектурное прорыв.
Один из комментариев авторов: используемый здесь “истинный ответ” — это тоже прокси — совпадение слов на уровне токенов, а не человеческое суждение. Судьи хорошо коррелируют с этим метрикой, но насколько совпадение слов действительно отражает человеческое восприятие качества — вопрос открытый.
Две особенности для развертывания: каскадная система сначала использует легкую модель, а при неоднозначных оценках подключает более тяжелые, что снижает затраты оценки до 72.7% при самом агрессивном режиме, хотя корреляция при этом падает примерно до 0.51. Онлайн-калибровка, работающая без ручной настройки, постоянно выявляет семантическое качество как главный сигнал и корректирует веса, увеличивая его в 4.7 раза по сравнению с начальным.
Где система еще испытывает трудности
Оценщики работают неравномерно в разных задачах. В вопросах-ответах корреляция достигает 0.830. В суммировании — падает до 0.199. Статья объясняет это не ошибками судей, а метрикой оценки: простое совпадение слов плохо отражает качество суммирования, поэтому модели, обученные на ней, учатся отслеживать слабый сигнал. Авторы называют это основной открытой проблемой, а не скрытым ограничением.
Это описание согласуется с тем, как статья представляет свои результаты — методично, с четким указанием ошибок и улучшений. После четырех публикаций в этой области работа выглядит скорее как постепенное устранение пробелов, чем как анонс продукта, — команда намерена реально внедрить эти решения.