Ф'ючерси
Сотні безстрокових контрактів
TradFi
Золото
Одна платформа для світових активів
Опціони
Hot
Торгівля ванільними опціонами європейського зразка
Єдиний рахунок
Максимізуйте ефективність вашого капіталу
Демо торгівля
Вступ до ф'ючерсної торгівлі
Підготуйтеся до ф’ючерсної торгівлі
Ф'ючерсні події
Заробляйте, беручи участь в подіях
Демо торгівля
Використовуйте віртуальні кошти для безризикової торгівлі
Запуск
CandyDrop
Збирайте цукерки, щоб заробити аірдропи
Launchpool
Швидкий стейкінг, заробляйте нові токени
HODLer Airdrop
Утримуйте GT і отримуйте масові аірдропи безкоштовно
Pre-IPOs
Отримайте повний доступ до глобальних IPO акцій.
Alpha Поінти
Ончейн-торгівля та аірдропи
Ф'ючерсні бали
Заробляйте фʼючерсні бали та отримуйте аірдроп-винагороди
Інвестиції
Simple Earn
Заробляйте відсотки за допомогою неактивних токенів
Автоінвестування
Автоматичне інвестування на регулярній основі
Подвійні інвестиції
Прибуток від волатильності ринку
Soft Staking
Earn rewards with flexible staking
Криптопозика
0 Fees
Заставте одну криптовалюту, щоб позичити іншу
Центр кредитування
Єдиний центр кредитування
Центр багатства VIP
Преміальні плани зростання капіталу
Управління приватним капіталом
Розподіл преміальних активів
Квантовий фонд
Квантові стратегії найвищого рівня
Стейкінг
Стейкайте криптовалюту, щоб заробляти на продуктах PoS
Розумне кредитне плече
Кредитне плече без ліквідації
Випуск GUSD
Мінтинг GUSD для прибутку RWA
Акції
AI
Gate AI
Ваш універсальний AI-помічник для спілкування
Gate AI Bot
Використовуйте Gate AI безпосередньо у своєму соціальному додатку
GateClaw
Gate Блакитний Лобстер — готовий до використання
Gate for AI Agent
AI-інфраструктура, Gate MCP, Skills і CLI
Gate Skills Hub
Понад 10 000 навичок
Від офісу до трейдингу: універсальна база навичок для ефективнішої роботи з AI
GateRouter
Розумний вибір із понад 30 моделей ШІ, без додаткових витрат (0%)
Perplexity розкриває метод після тренування для пошукового агента, модель Qwen3.5 перевищує GPT-5.4 за точністю та вартістю
Згідно з моніторингом Dongcha Beating, команда досліджень Perplexity опублікувала технічну статтю, яка детально описує процес після тренування для свого агента веб-пошуку. Цей процес базується на відкритих моделях Qwen3.5-122B-A10B та Qwen3.5-397B-A17B, із застосуванням двоступеневого підходу: спочатку використовується кероване тонке налаштування (SFT) для встановлення необхідних поведінкових характеристик для розгортання, таких як дотримання інструкцій та мовна послідовність; потім, онлайн-навчання з підкріпленням політики (RL) оптимізує точність пошуку та ефективність використання інструментів. Фаза RL використовує алгоритм GRPO, а навчальні дані складаються з двох частин: по-перше, самостійно розроблений набір даних з багатоступеневих перевірюваних питань і відповідей, який формує питання, що вимагають 2-4 кроки логіки з внутрішніх початкових запитів і перевіряє унікальність відповіді за допомогою кількох незалежних розв’язувачів; по-друге, загальні дані діалогу на основі критеріїв оцінювання (rubric), які перетворюють вимоги до розгортання, такі як дотримання інструкцій та форматні обмеження, у об’єктивно перевіряємі атомарні умови, щоб запобігти деградації поведінки, встановленої під час SFT, у фазі RL. Основою дизайну винагороди є гейтована агрегація: бали переваги враховуються лише тоді, коли базовий рівень правильний (тобто, питання-відповідь правильні або всі критерії оцінювання виконані), що запобігає приховуванню фактичних помилок високими сигналами переваги. Пенальті за ефективність застосовуються за допомогою методу внутрішньогрупового закріплення, де правильні відповіді в одній групі слугують базовою лінією для м’якого накладання штрафів за надмірну кількість викликів інструментів і довжину генерації. Оцінка показує, що після тренування Qwen3.5-397B-SFT-RL працює оптимально на кількох бенчмарках пошуку. На FRAMES одне виклик інструменту досягає 57,3%, перевищуючи GPT-5.4 на 5,7 процентних пунктів і Sonnet 4.6 на 4,7 пунктів. За середнього бюджету (4 виклики інструментів), досягає 73,9%, з вартістю 2,0 центів за запит; за тих самих умов GPT-5.4 досягає 67,8% при 8,5 центах, а Sonnet 4.6 — 62,4% при 15,3 центах. Дані про вартість розраховані на основі публічно доступних цін на API від кожного постачальника, без урахування кеш-оптимізації.