暗号資産を購入

支払い方法

USD

購入 & 売却

Visa、Mastercard、SEPAなどに対応

柔軟な取引、手数料ゼロ

暗号資産を使って世界中で支払いができます

基礎

暗号を自由に取引

証拠金取引

レバレッジを使って利益を拡大しましょう

即時スワップと自動投資

手数料ゼロ＆スリッページなしで、どんなサイズでも取引可能

レバレッジポジションを簡単に利用

上場前取引

上場前の新規トークンを取引

上級

Gateウォレットでオンチェーン取引を行う

新しいオンチェーントークンにスマートアクセス

自動取引によるスマート戦略

専門家の取引戦略をフォロー

プラットフォーム間で共有される 1 つの証拠金残高

数百の無期限先物にアクセス

世界の伝統資産を一つのプラットフォームで

オプション取引

ヨーロッパ式のバニラオプションで取引できます

資本効率の最大化

先物取引の紹介

先物取引の準備をする

先物イベント

イベントに参加して報酬を獲得

仮想資金を使ってリスクのない取引を体験しよう。

ローンチパッド

キャンディーを集めてAirDropを獲得

クイックステーキング潜在的な新しいトークンを獲得しよう

GTを保有して、大量のAirDropを無料で入手

世界中の株式IPOにフルアクセス

Alphaポイント

オンチェーン資産を取引してAirdropを獲得

先物ポイント

先物ポイントを獲得し、Airdrop報酬を受け取りましょう。

投資

遊休トークンで利息を稼ぐ

定期的に自動投資

デュアル投資

市場のボラティリティから利益を得る

ソフトステーキング

フレキシブルステーキングで報酬を獲得します

暗号資産ローン

1つの暗号通貨を担保に別の暗号通貨を借りる

レンディングセンター

ワンストップレンディングハブ

VIPウェルスハブ

プレミアム資産成長プラン

プライベートウェルスマネジメント

プレミアム資産配分

クオンツ資金

トップレベルのクオンツ戦略

ステーキング

暗号をステーキングしてPoS製品で稼ぐ

スマートレバレッジ

清算なしレバレッジ

GUSDをミントしてRWAリターンを獲得

暗号資産の価値を発見しよう

暗号資産相場分析ライブ

暗号資産トレーダーと意見交換

暗号資産業界の最新情報

もっと

プロモーション

イベントセンター

アクティビティに参加して報酬を獲得

友達を招待して紹介報酬を獲得

アフィリエイトプログラム

限定コミッション報酬を獲得

影響力を高めてAirdropを獲得

アナウンスメント

プラットフォームのリアルタイム更新

暗号資産の洞察を得よう

VIPサービス

大幅な手数料割引

ワンストップ資産管理ソリューション

機関向けサービス

エンタープライズ向け資産ソリューション

OTC銀行送金

法定通貨の入金と出金

ブローカープログラム

豊富なAPIリベートメカニズム

AI

あなたの対話型AI万能パートナー

ソーシャルアプリで Gate AI をそのまま利用

Gateブルーロブスター、すぐに使える

Gate for AI Agent

AIインフラストラクチャ、Gate MCP、Skills、CLI

Gate Skills Hub

1万以上のスキル

オフィス業務から取引まで、AIをもっと活用できるワンストップスキルライブラリ

40以上のAIモデルをスマートに選択、追加料金0%

その他

ヘルプセンター

FAQ とヘルプガイドを見つける

暗号投資について学ぶ

パートナー

チャンピオンと共に成長

準備金証明

Gate は100%準備金証明を約束します

あなたの資産を安全に保護します

なぜ大規模モデルは「馬嘉祺」を書き出せないのか？MiniMax全語彙表のスキャンで、約5％のトークンが後の訓練で忘れられていることが判明

2026-05-09 07:52:24

据动察 Beating 监测，MiniMax 发布技术博客，披露其 M2 系列大模型无法输出人名「马嘉祺」的根因排查过程。
排查从一个个例出发，最终揭示了一个波及整个词表的系统性退化问题。
根因是分词器（tokenizer，将文字切分为模型处理单元的组件）在训练时将「嘉祺」合并成了一个独立 token。
预训练阶段模型见过大量互联网文本，学会了这个 token；但后训练的对话数据中，包含「嘉祺」的样本不到 5 条。
后训练过程中，tool_call 标记、代码符号等高频 token 持续更新周围的向量空间，把「嘉祺」这类低频 token 挤到了错误的方向。
模型仍然「认识」马嘉祺，能准确回答相关信息，丢失的只是输出这个 token 的能力。
团队随后对约 20 万 token 的完整词表做了全量扫描，发现约 4.9% 的 token 发生了显著退化。
退化最严重的是日语：29.7% 的日语 token 显著退化，远超韩语 3.3%、俄语 3.7%、中文 3.9% 和英文 3.5%。
退化排名靠前的还有「传奇私服」「无痛人流」等互联网 SEO 垃圾词，机制与「嘉祺」完全相同。
日语的严重退化还解开了一个旧谜。此前模型在日语对话中偶尔混入俄语或韩语字符，一直找不到原因。
这次分析表明，日语 token 参数漂移后与其他语言的 token 在向量空间中混淆，既导致日语 token 被错误激活（语言混杂），也把相邻的低频中文 token 挤出正常概率范围（token 遗忘）。
修复方案是构造一份覆盖全词表的合成数据，让模型用简单的复读任务练到每个 token。
效果立竿见影：日语回答中混入俄文字符的比例从 47% 降至 1%，全词表输出参数稳定度（余弦相似度）从最低 0.329 升至全部高于 0.97。

原文表示

このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております（表明・保証をするものではありません）。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。

報酬
いいね
コメント
リポスト
共有

コメント

コメントを追加

コメントを追加

コメントなし

人気の話題
もっと見る
#
GateSquareMayTradingShare
945.1K 人気度
#
BTCBackAbove80K
59.43M 人気度
#
IsraelStrikesIranBTCPlunges
45.32K 人気度
#
JapanTokenizesGovernmentBonds
1.89M 人気度
#
#DailyPolymarketHotspot
862.69K 人気度

ピン

サイトマップ