10,000 USDT 悬赏,寻找Gate广场跟单金牌星探!🕵️♀️
挖掘顶级带单员,赢取高额跟单体验金!
立即参与:https://www.gate.com/campaigns/4624
🎁 三大活动,奖金叠满:
1️⃣ 慧眼识英:发帖推荐带单员,分享跟单体验,抽 100 位送 30 USDT!
2️⃣ 强力应援:晒出你的跟单截图,为大神打 Call,抽 120 位送 50 USDT!
3️⃣ 社交达人:同步至 X/Twitter,凭流量赢取 100 USDT!
📍 标签: #跟单金牌星探 #GateCopyTrading
⏰ 限时: 4/22 16:00 - 5/10 16:00 (UTC+8)
详情:https://www.gate.com/announcements/article/50848
MiniMax:大模型无法输出人名「马嘉祺」的根因分析
币界网消息,MiniMax发布技术博客,披露其m2系列大模型无法输出人名「马嘉祺」的根因排查过程。排查从一个个例出发,最终揭示了一个波及整个词表的系统性退化问题。根因是分词器在训练时将「嘉祺」合并成了一个独立token。预训练阶段模型见过大量互联网文本,学会了这个token但后训练的对话数据中,包含「嘉祺」的样本不到5条。后训练过程中,tool_call标记、代码符号等高频token持续更新周围的向量空间,把「嘉祺」这类低频token挤到了错误的方向。模型仍然「认识」马嘉祺,能准确回答相关信息,丢失的只是输出这个token的能力。团队随后对约20万token的完整词表做了全量扫描,发现约4.9%的token发生了显著退化。退化最严重的是日语:29.7%的日语token显著退化,远超韩语3.3%、俄语3.7%、中文3.9%和英文3.5%。