暗号資産を購入

支払い方法

USD

購入 & 売却

Visa、Mastercard、SEPAなどに対応

柔軟な取引、手数料ゼロ

暗号資産を使って世界中で支払いができます

基礎

暗号を自由に取引

証拠金取引

レバレッジを使って利益を拡大しましょう

即時スワップと自動投資

手数料ゼロ＆スリッページなしで、どんなサイズでも取引可能

レバレッジポジションを簡単に利用

上場前取引

上場前の新規トークンを取引

上級

Gateウォレットでオンチェーン取引を行う

新しいオンチェーントークンにスマートアクセス

自動取引によるスマート戦略

専門家の取引戦略をフォロー

プラットフォーム間で共有される 1 つの証拠金残高

数百の無期限先物にアクセス

世界の伝統資産を一つのプラットフォームで

オプション取引

ヨーロッパ式のバニラオプションで取引できます

資本効率の最大化

先物取引の紹介

先物取引の準備をする

先物イベント

イベントに参加して報酬を獲得

仮想資金を使ってリスクのない取引を体験しよう。

ローンチパッド

キャンディーを集めてAirDropを獲得

クイックステーキング潜在的な新しいトークンを獲得しよう

GTを保有して、大量のAirDropを無料で入手

世界中の株式IPOにフルアクセス

Alphaポイント

オンチェーン資産を取引してAirdropを獲得

先物ポイント

先物ポイントを獲得し、Airdrop報酬を受け取りましょう。

投資

遊休トークンで利息を稼ぐ

定期的に自動投資

デュアル投資

市場のボラティリティから利益を得る

ソフトステーキング

フレキシブルステーキングで報酬を獲得します

暗号資産ローン

1つの暗号通貨を担保に別の暗号通貨を借りる

レンディングセンター

ワンストップレンディングハブ

VIPウェルスハブ

プレミアム資産成長プラン

プライベートウェルスマネジメント

プレミアム資産配分

クオンツ資金

トップレベルのクオンツ戦略

ステーキング

暗号をステーキングしてPoS製品で稼ぐ

スマートレバレッジ

清算なしレバレッジ

GUSDをミントしてRWAリターンを獲得

暗号資産の価値を発見しよう

暗号資産相場分析ライブ

暗号資産トレーダーと意見交換

暗号資産業界の最新情報

もっと

プロモーション

イベントセンター

アクティビティに参加して報酬を獲得

友達を招待して紹介報酬を獲得

アフィリエイトプログラム

限定コミッション報酬を獲得

影響力を高めてAirdropを獲得

アナウンスメント

プラットフォームのリアルタイム更新

暗号資産の洞察を得よう

VIPサービス

大幅な手数料割引

ワンストップ資産管理ソリューション

機関向けサービス

エンタープライズ向け資産ソリューション

OTC銀行送金

法定通貨の入金と出金

ブローカープログラム

豊富なAPIリベートメカニズム

AI

あなたの対話型AI万能パートナー

ソーシャルアプリで Gate AI をそのまま利用

Gateブルーロブスター、すぐに使える

Gate for AI Agent

AIインフラストラクチャ、Gate MCP、Skills、CLI

Gate Skills Hub

1万以上のスキル

オフィス業務から取引まで、AIをもっと活用できるワンストップスキルライブラリ

30以上のAIモデルをスマートに選択、追加料金0%

その他

ヘルプセンター

FAQ とヘルプガイドを見つける

暗号投資について学ぶ

パートナー

チャンピオンと共に成長

準備金証明

Gate は100%準備金証明を約束します

あなたの資産を安全に保護します

Perplexityは、検索エージェントの事後学習方法を明らかにし、Qwen3.5モデルは精度とコストの両面でGPT-5.4を上回る

AirdropBlackHole

2026-04-28 16:22:47

ドンチャビーティングによる監視によると、Perplexity研究チームは、そのウェブ検索エージェントの事後トレーニングプロセスの詳細を記した技術記事を公開しました。このプロセスは、オープンソースモデルのQwen3.5-122B-A10BとQwen3.5-397B-A17Bに基づいており、二段階のアプローチを採用しています。まず、指示遵守や言語の一貫性などの展開に必要な動作を確立するために、監督付き微調整(SFT)を行います。次に、オンラインポリシー強化学習(RL)を用いて検索精度とツール使用効率を最適化します。RLフェーズではGRPOアルゴリズムを利用し、トレーニングデータは二つの部分から構成されます。第一に、内部のシードクエリから2〜4ホップの推論を必要とする質問を構築し、複数の独立した解答者によって回答の一意性を検証する自己開発の多ホップ検証可能な質問回答データセット。第二に、スコア基準(ルーブリック)に基づく一般的な対話データであり、指示遵守やフォーマット制約といった展開要件を客観的に検査可能な原子条件に変換し、SFT中に確立された動作の劣化を防ぎます。報酬設計の核心はゲート付き集約です。基準が正しい場合(すなわち、質問回答が正しいか、すべてのスコア基準を満たす場合)にのみ、優先スコアが計算に考慮され、高い優先信号が事実誤認を隠すのを防ぎます。効率性のペナルティは、同一グループ内の正解を基準として滑らかなペナルティを課すグループ内アンカー法を用いて適用されます。評価の結果、事後トレーニングされたQwen3.5-397B-SFT-RLは複数の検索ベンチマークで最適な性能を示しました。FRAMESでは、単一のツール呼び出しで57.3％を達成し、GPT-5.4の5.7ポイント上回り、Sonnet 4.6の4.7ポイント上回っています。中程度の予算(4ツール呼び出し)では、73.9％に達し、クエリあたりのコストは2.0セントです。同じ条件下で、GPT-5.4は67.8％を8.5セントで達成し、Sonnet 4.6は62.4％を15.3セントで達成しています。コストデータは、各ベンダーの公開API料金に基づいて計算されており、キャッシュ最適化は除外されています。

原文表示

このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております（表明・保証をするものではありません）。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。

報酬
いいね
コメント
リポスト
共有

コメント

コメントを追加

コメントを追加

コメントなし

人気の話題
もっと見る
#
WCTCTradingKingPK
342.39K 人気度
#
CryptoMarketsDipSlightly
247.88K 人気度
#
IsraelStrikesIranBTCPlunges
35.58K 人気度
#
#DailyPolymarketHotspot
685.47K 人気度
#
StrategyAccumulates2xMiningRate
139.46M 人気度

ピン

サイトマップ