Сообщение с сайта CoinWorld: разработчики Luthira Abeykoon и Krish Chhajer перенесли MicroGPT Карпаты (всего 4 192 параметра) на FPGA с помощью SystemVerilog, скорость генерации превышает 50 000 токенов/сек. Этот проект Talos-V2 (Tensor Accelerated Logic for On-Chip Systems) открыт на GitHub, работает на образовательном FPGA Intel Cyclone V DE1-SOC, веса хранятся в встроенной ROM в формате фиксированной точки Q4.12. Реализация матрично-векторного умножения в модели выполнена в виде 16-канального пульсирующего массива (Systolic Array), Q/K/V проекции, MLP, LM

CoinNetwork

2026-05-03 02:06:11

Китайская крипто-новостная сеть сообщает, что разработчики Luthira Abeykoon и Krish Chhajer перенесли MicroGPT Карпаты (всего 4192 параметра) на FPGA с помощью SystemVerilog, достигнув скорости генерации более 50 000 токенов в секунду. Этот проект Talos-V2 (Tensor Accelerated Logic for On-Chip Systems) уже открыт на GitHub и работает на учебном FPGA Intel Cyclone V DE1-SOC, веса хранятся в on-chip ROM в формате фиксированной точки Q4.12. Реализация матрично-векторного умножения в модели выполнена в виде 16-канального систолического массива, при этом проекции Q/K/V, MLP и LM Head используют один и тот же блок, по очереди запускаясь. Реализация механизма внимания требует разделения на восемь этапов. Авторы отмечают, что проект нацелен на преобразование каждого шага трансформерного вывода в визуализируемое аппаратное обеспечение: память, счетчики, автомат и таблицы поиска.

Посмотреть Оригинал

На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .

Награда
лайк
комментарий
Репост
Поделиться

комментарий

Добавить комментарий

Нет комментариев

Популярные темы
Подробнее
#
WCTCTradingKingPK
530.82K Популярность
#
USSeeksStrategicBitcoinReserve
58.75M Популярность
#
IsraelStrikesIranBTCPlunges
39.28K Популярность
#
BitcoinETFOptionLimitQuadruples
1.02M Популярность
#
#FedHoldsRateButDividesDeepen
42.09K Популярность

Закрепить

Карта сайта

Создание трансформера в виде полностью аппаратной схемы без использования GPU — достичь 50 000 токенов в секунду

Популярные темы

WCTCTradingKingPK

USSeeksStrategicBitcoinReserve

IsraelStrikesIranBTCPlunges

BitcoinETFOptionLimitQuadruples

#FedHoldsRateButDividesDeepen

Закрепить