Фьючерсы
Доступ к сотням фьючерсов
TradFi
Золото
Одна платформа мировых активов
Опционы
Hot
Торги опционами Vanilla в европейском стиле
Единый счет
Увеличьте эффективность вашего капитала
Демо-торговля
Введение в торговлю фьючерсами
Подготовьтесь к торговле фьючерсами
Фьючерсные события
Получайте награды в событиях
Демо-торговля
Используйте виртуальные средства для торговли без риска
Запуск
CandyDrop
Собирайте конфеты, чтобы заработать аирдропы
Launchpool
Быстрый стейкинг, заработайте потенциальные новые токены
HODLer Airdrop
Удерживайте GT и получайте огромные аирдропы бесплатно
Launchpad
Будьте готовы к следующему крупному токен-проекту
Alpha Points
Торгуйте и получайте аирдропы
Фьючерсные баллы
Зарабатывайте баллы и получайте награды аирдропа
Инвестиции
Simple Earn
Зарабатывайте проценты с помощью неиспользуемых токенов
Автоинвест.
Автоинвестиции на регулярной основе.
Бивалютные инвестиции
Доход от волатильности рынка
Мягкий стейкинг
Получайте вознаграждения с помощью гибкого стейкинга
Криптозаймы
0 Fees
Заложите одну криптовалюту, чтобы занять другую
Центр кредитования
Единый центр кредитования
Одна статья потрясла триллионный рынок, хранилищные чипы рухнули...
Никто не ожидал, что в этот среду на открытии американского рынка сектор хранения чипов переживёт «черное время», акции гигантов резко пали —
К закрытию акции Micron снизились на 4%, Western Digital — на 4,4%, Seagate — на 5,6%, а SanDisk — на 6,5%.
Искрой этого ценового обвала стал алгоритм сжатия TurboQuant, выпущенный Google.
Как известно, когда большие модели работают, KV-кэш (KV cache) — это буквально «пожиратель денег» в памяти.
Чтобы не пересчитывать ранее использованные токены, LLM поддерживает «оперативную память», которая с ростом диалога быстро раздувается, как снежный ком.
Google’s TurboQuant предлагает очень «жесткий» способ уменьшения размера:
Во-первых, выполняет «вращение» высокоразмерных векторов в KV-кэше, затем переводит их в полярные координаты, что сразу сводит использование памяти к нулю.
Затем, с помощью всего лишь 1-битного дополнительного пространства, вставляет «калибратор» — математический «корректор», который точно сглаживает систематическую погрешность, вызванную сжатием.
Статья о TurboQuant будет официально опубликована на ICLR 2026, которая пройдет в следующем месяце.
Результаты впечатляют: без обучения с нуля, TurboQuant сжимает кэш до невероятных 3 бит.
Таким образом, расходы на KV-кэш сокращаются в 6 раз, а при этом практически не снижается производительность при выводе.
На H100, по сравнению с базовым 32-битным режимом, скорость внимания при 4-битных вычислениях выросла в 8 раз. Это не только экономит место, но и ускоряет работу.