Фьючерсы
Доступ к сотням фьючерсов
TradFi
Золото
Одна платформа мировых активов
Опционы
Hot
Торги опционами Vanilla в европейском стиле
Единый счет
Увеличьте эффективность вашего капитала
Демо-торговля
Введение в торговлю фьючерсами
Подготовьтесь к торговле фьючерсами
Фьючерсные события
Получайте награды в событиях
Демо-торговля
Используйте виртуальные средства для торговли без риска
Запуск
CandyDrop
Собирайте конфеты, чтобы заработать аирдропы
Launchpool
Быстрый стейкинг, заработайте потенциальные новые токены
HODLer Airdrop
Удерживайте GT и получайте огромные аирдропы бесплатно
Pre-IPOs
Откройте полный доступ к глобальным IPO акций
Alpha Points
Торгуйте и получайте аирдропы
Фьючерсные баллы
Зарабатывайте баллы и получайте награды аирдропа
Инвестиции
Simple Earn
Зарабатывайте проценты с помощью неиспользуемых токенов
Автоинвест.
Автоинвестиции на регулярной основе.
Бивалютные инвестиции
Доход от волатильности рынка
Мягкий стейкинг
Получайте вознаграждения с помощью гибкого стейкинга
Криптозаймы
0 Fees
Заложите одну криптовалюту, чтобы занять другую
Центр кредитования
Единый центр кредитования
Рекламные акции
AI
Gate AI
Ваш универсальный AI-ассистент для любых задач
Gate AI Bot
Используйте Gate AI прямо в вашем социальном приложении
GateClaw
Gate Синий Лобстер — готов к использованию
Gate for AI Agent
AI-инфраструктура: Gate MCP, Skills и CLI
Gate Skills Hub
Более 10 тыс навыков
От офиса до трейдинга: единая база навыков для эффективного использования ИИ
GateRouter
Умный выбор из более чем 40 моделей ИИ, без дополнительных затрат (0%)
Максимальное увеличение скорости в 3 раза и нулевые потери, открытая модель декодирования MTP для всей серии Gemma4 от Google
Согласно мониторингу Beating, Google выпустила и открыла исходный код черновой модели серии Gemma 4 для предсказания нескольких токенов (MTP). Это легкая вспомогательная модель с архитектурой спекулятивного декодирования (speculative decoding, предположительное декодирование), которая, основываясь на сохранении окончательного подтверждающего веса основной модели, обеспечивает ускорение вывода до 3 раз при сохранении качества вывода и логического рассуждения.
Стандартная большая языковая модель может генерировать только один токен за раз, что легко ограничивается пропускной способностью видеопамяти и вызывает простои вычислительных ресурсов. Решение MTP позволяет легкой черновой модели использовать свободные вычислительные мощности, предварительно предсказывая сразу несколько будущих токенов, а затем параллельно проверять их с помощью тяжелой целевой модели, такой как 31B. Если целевая модель согласна с черновиком, она принимает всю последовательность сразу. Для повышения эффективности черновая модель напрямую делится активированными состояниями и кешем KV (хранящим исторический контекст для избегания повторных вычислений) целевой модели; для моделей на стороне устройства E2B и E4B команда также внедрила кластеризацию в слой внедрения.
В настоящее время модель MTP полностью открыта под лицензией Apache 2.0, как и Gemma 4, и нативно поддерживает основные фреймворки для вывода, такие как vLLM, SGLang и Ollama. Это значительное ускорение снижает порог входа для разработчиков, позволяя запускать модели MoE 26B и плотные модели 31B на обычных потребительских видеокартах, а также обеспечивать реальное взаимодействие с ИИ на мобильных устройствах с меньшим энергопотреблением.