ME News Новини, 18 квітня (UTC+8), команда Moonshot AI нещодавно оголосила, що їхня технологія розділення Prefill (попереднє заповнення) та Decode (декодування) успішно масштабувалася від одного кластеру до міжданих центрів та гетерогенних апаратних середовищ. За словами у статті, цей крок має потенціал значно знизити вартість обчислення кожного токена. Раніше розгортання цієї технології було ускладнене через витрати на передачу KV cache. Цей прорив став можливим завдяки їхній гібридній моделі Kimi Linear. (Джерело: InFoQ)

Переглянути оригінал

Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.

6 лайків

Нагородити
6
3
1
Поділіться

Прокоментувати

Додати коментар

PublicBlockchainUnderTheAurora

· 12год тому

Цікаво, як обробляється затримка між DC, у статті не докладно описано.

Переглянути оригіналвідповісти на0

ExitLiquidityIntern

· 12год тому

Змішана модельна архітектура здається ключовою змінною, чекати технічних деталей

Переглянути оригіналвідповісти на0

GateUser-c1cab702

· 12год тому

Від однієї кластеру до кількох дата-центрів — уявіть собі, наскільки складною є ця робота.

Переглянути оригіналвідповісти на0

Популярні теми
Дізнатися більше
#
WinGoldBarsWithGrowthPoints
1.19M Популярність
#
WTICrudeFallsBelow90Dollars
1.15M Популярність
#
IsraelStrikesIranBTCPlunges
51.23K Популярність
#
StockTradingChallengeUpTo17000U
166.31K Популярність
#
USIranNegotiationGame
9.39M Популярність

Закріплено

карта сайту

Moonshot AI розширює технологію розділення Prefill/Decode на міждані центрами та гетерогічне обладнання

Популярні теми

WinGoldBarsWithGrowthPoints

WTICrudeFallsBelow90Dollars

IsraelStrikesIranBTCPlunges

StockTradingChallengeUpTo17000U

USIranNegotiationGame

Закріплено