Фьючерсы
Доступ к сотням фьючерсов
TradFi
Золото
Одна платформа мировых активов
Опционы
Hot
Торги опционами Vanilla в европейском стиле
Единый счет
Увеличьте эффективность вашего капитала
Демо-торговля
Введение в торговлю фьючерсами
Подготовьтесь к торговле фьючерсами
Фьючерсные события
Получайте награды в событиях
Демо-торговля
Используйте виртуальные средства для торговли без риска
Запуск
CandyDrop
Собирайте конфеты, чтобы заработать аирдропы
Launchpool
Быстрый стейкинг, заработайте потенциальные новые токены
HODLer Airdrop
Удерживайте GT и получайте огромные аирдропы бесплатно
Pre-IPOs
Откройте полный доступ к глобальным IPO акций
Alpha Points
Торгуйте и получайте аирдропы
Фьючерсные баллы
Зарабатывайте баллы и получайте награды аирдропа
Инвестиции
Simple Earn
Зарабатывайте проценты с помощью неиспользуемых токенов
Автоинвест.
Автоинвестиции на регулярной основе.
Бивалютные инвестиции
Доход от волатильности рынка
Мягкий стейкинг
Получайте вознаграждения с помощью гибкого стейкинга
Криптозаймы
0 Fees
Заложите одну криптовалюту, чтобы занять другую
Центр кредитования
Единый центр кредитования
Рекламные акции
AI
Gate AI
Ваш универсальный AI-ассистент для любых задач
Gate AI Bot
Используйте Gate AI прямо в вашем социальном приложении
GateClaw
Gate Синий Лобстер — готов к использованию
Gate for AI Agent
AI-инфраструктура: Gate MCP, Skills и CLI
Gate Skills Hub
Более 10 тыс навыков
От офиса до трейдинга: единая база навыков для эффективного использования ИИ
GateRouter
Умный выбор из более чем 30 моделей ИИ, без дополнительных затрат (0%)
Самая мощная открытая модель deepseek v4 наконец-то вышла!
Модель с 1,6 триллиона параметров, лицензия MIT, объем видеопамяти для длинных текстов уменьшен до одной десятой от V3.2
По данным мониторинга Beating, предварительный просмотр открытой версии DeepSeek серии V4, лицензия MIT, веса уже доступны на Hugging Face и ModelScope. В серии две модели MoE: V4-Pro с общим количеством параметров 1,6 трлн, активностью 49 млрд на токен (490 сотен миллионов); V4-Flash с общим количеством параметров 284 млрд (2840 сотен миллионов), активностью 13 млрд (130 сотен миллионов). Обе модели поддерживают контекст около 1 миллиона токенов.
Три улучшения архитектуры: гибридный механизм внимания (сжатое разреженное внимание CSA + тяжелое сжатое внимание HCA) значительно снижает расходы на длинный контекст, при контексте около 1 миллиона токенов FLOPs для одиночного токена при выводе V4-Pro составляет всего 27% от V3.2, кеш KV (использование видеопамяти для хранения истории при выводе) — всего 10% от V3.2; ограничение многообразия сверхсвязи mHC вместо традиционного остаточного соединения, повышая стабильность передачи сигналов между слоями; обучение переходит на оптимизатор Muon для ускорения сходимости. Предварительное обучение включает более 32 трлн токенов.
Двухэтапное дообучение: сначала с помощью SFT и GRPO проводится обучение экспертов по различным областям, затем онлайн-дистилляцией объединяются в одну модель. V4-Pro-Max (режим максимальной мощности вывода) заявляет о себе как о самом мощном открытом моделировании, базовые показатели кодирования достигают топовых уровней, разрыв в выводе и задачах агента по сравнению с закрытыми передовыми моделями значительно сокращается. V4-Flash-Max после достаточного времени размышления показывает вывод, близкий к Pro, но в чистых знаниях и сложных задачах агента ограничен масштабом параметров. Веса хранятся в смешанной точности FP4+FP8.