Новости Coin World: Google внедрила архитектуру Multi-Token Prediction (MTP) в устройства серий Pixel 9 и Pixel 10, напрямую ускорив встроенную модель Gemini Nano v3.


Новая архитектура прикрепляет легковесную голову предсказания трансформера к хвосту замороженной основной модели, повышая скорость вывода на устройстве более чем на 50%, сохраняя при этом исходное выравнивание безопасности и качество вывода.
Чтобы избежать повторных накладных расходов оперативной памяти при авторегрессионной генерации из-за черновых вычислений, Google разработала механизм нулевого копирования, который успешно использует уже вычисленные активации признаков основной модели, значительно повышая точность предсказания кандидатных токенов.
В реальных бизнес-сценариях эта архитектура позволяет модели в среднем успешно предсказывать почти на 2 токена больше за один вывод, снижая частоту частых пробуждений основного процессора для проверки, тем самым экономя энергопотребление системы.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • 2
  • 1
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
DewdropSapling
· 2ч назад
Архитектура MTP от Google действительно впечатляет: ускорение на 50% и снижение энергопотребления, мобильный ИИ меняется.
Посмотреть ОригиналОтветить0
AirdropCartographer
· 2ч назад
Механизм нулевого копирования спроектирован довольно умно, повторное использование активаций признаков позволяет избежать взрыва памяти, инженерные детали на высоте.
Посмотреть ОригиналОтветить0
  • Закреплено