По данным CoinWorld, MiniMax раскрыл процесс диагностики невозможности вывода имени "Ма Цзяцю" в серии больших моделей m2. Основная причина — токенизатор объединил "Цзяцю" в отдельный токен, который был встречен во время предварительной тренировки, но в последующих диалогах встречается очень редко, что привело к смещению обновлений часто встречающихся токенов, из-за чего изменились векторные представления окружающих их токенов, и вывод низкочастотных токенов был потерян. При полном сканировании около 200 тысяч токенов было обнаружено значительное ухудшение в 4,9%, особенно в японском языке — 29,7%, в корейском — 3,3%, в русском — 3,7%, в китайском — 3,9%, в английском — 3,5%.

CoinNetwork

2026-05-09 07:07:30

Генерация тезисов в процессе

币界网消息，MiniMax发布技术博客，披露其m2系列大模型无法输出人名「马嘉祺」的根因排查过程。
排查从一个个例出发，最终揭示了一个波及整个词表的系统性退化问题。
根因是分词器在训练时将「嘉祺」合并成了一个独立token。
预训练阶段模型见过大量互联网文本，学会了这个token但后训练的对话数据中，包含「嘉祺」的样本不到5条。
后训练过程中，tool_call标记、代码符号等高频token持续更新周围的向量空间，把「嘉祺」这类低频token挤到了错误的方向。
模型仍然「认识」马嘉祺，能准确回答相关信息，丢失的只是输出这个token的能力。
团队随后对约20万token的完整词表做了全量扫描，发现约4.9%的token发生了显著退化。
退化最严重的是日语：29.7%的日语token显著退化，远超韩语3.3%、俄语3.7%、中文3.9%和英文3.5%。

Посмотреть Оригинал

На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .

Награда
лайк
комментарий
Репост
Поделиться

комментарий

Добавить комментарий

Нет комментариев

Популярные темы
Подробнее
#
GateSquareMayTradingShare
960.34K Популярность
#
BTCBackAbove80K
59.43M Популярность
#
IsraelStrikesIranBTCPlunges
45.42K Популярность
#
JapanTokenizesGovernmentBonds
1.89M Популярность
#
#DailyPolymarketHotspot
863.88K Популярность

Закрепить

Карта сайта

MiniMax：Анализ причин, по которым крупные модели не могут вывести имя человека «Ма Цзяци»

Популярные темы

GateSquareMayTradingShare

BTCBackAbove80K

IsraelStrikesIranBTCPlunges

JapanTokenizesGovernmentBonds

#DailyPolymarketHotspot

Закрепить