Темна сторона Місяця та новий документ Тяньцзиньського університету: попереднє заповнення LLM може перетинати дата-центри, пропускна здатність моделі на 1Т зросла на 54%

Медійні новини повідомляють, що темна сторона місяця та Tsinghua University у arXiv запропонували Prefill-as-a-Service, що дозволяє запускати етап попереднього заповнення великих моделей у межах різних дата-центрів. За допомогою гібридної моделі уваги значно знижено пропускну здатність кешу KV, що дозволяє передавати кеш через Ethernet і повертати його для декодування у локальному кластері. Архітектура PrfaaS створює незалежний кластер попереднього заповнення, маршрутизуючи лише запити з довгим контекстом, що не потрапили у кеш, а короткі запити залишаються у локальному PD; також вводяться маршрутизація за довжиною та розподіл за пропускною здатністю. Практичні випробування з гібридною моделлю на 1 трильйон параметрів показали збільшення пропускної здатності на 54% порівняно з однорідним PD і на 32% порівняно з простим гібридом.

Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.

Нагородити
подобається
Прокоментувати
Репост
Поділіться

Прокоментувати

Додати коментар

Немає коментарів

Популярні теми
Дізнатися більше
#
WinGoldBarsWithGrowthPoints
1.23M Популярність
#
WTICrudeFallsBelow90Dollars
1.19M Популярність
#
IsraelStrikesIranBTCPlunges
51.49K Популярність
#
StockTradingChallengeUpTo17000U
193.02K Популярність
#
USIranNegotiationGame
9.41M Популярність

Закріплено

карта сайту

Популярні теми

WinGoldBarsWithGrowthPoints

WTICrudeFallsBelow90Dollars

IsraelStrikesIranBTCPlunges

StockTradingChallengeUpTo17000U

USIranNegotiationGame

Закріплено