Futuros
Aceda a centenas de contratos perpétuos
CFD
Ouro
Plataforma de ativos tradicionais globais
Opções
Hot
Negoceie Opções Vanilla ao estilo europeu
Conta Unificada
Maximize a eficiência do seu capital
Negociação de demonstração
Introdução à negociação de futuros
Prepare-se para a sua negociação de futuros
Eventos de futuros
Participe em eventos para recompensas
Negociação de demonstração
Utilize fundos virtuais para experimentar uma negociação sem riscos
Lançamento
CandyDrop
Recolher doces para ganhar airdrops
Launchpool
Faça staking rapidamente, ganhe potenciais novos tokens
HODLer Airdrop
Detenha GT e obtenha airdrops maciços de graça
Pre-IPOs
Desbloquear acesso completo a IPO de ações globais
Pontos Alpha
Negoceie ativos on-chain para airdrops
Pontos de futuros
Ganhe pontos de futuros e receba recompensas de airdrop
Investimento
Simple Earn
Ganhe juros com tokens inativos
Investimento automático
Invista automaticamente de forma regular.
Investimento Duplo
Aproveite a volatilidade do mercado
Soft Staking
Ganhe recompensas com staking flexível
Empréstimo de criptomoedas
0 Fees
Dê em garantia uma criptomoeda para pedir outra emprestada
Centro de empréstimos
Centro de empréstimos integrado
Promoções
Centro de atividades
Participe de atividades para recompensas
Referência
20 USDT
Convide amigos para recompensas de ref.
Programa de afiliados
Ganhe recomp. de comissão exclusivas
Gate Booster
Aumente a influência e ganhe airdrops
Announcements
Atualizações na plataforma em tempo real
Blog da Gate
Artigos da indústria cripto
Serviços VIP
Enormes descontos nas taxas
Gestão de ativos
Solução integral para a gestão de ativos
Institucional
Soluções de ativos digitais para empresas
Desenvolvedores (API)
Conecta-se ao ecossistema de aplicações Gate
Transferência Bancária OTC
Deposite e levante moeda fiduciária
Programa de corretora
Mecanismo generoso de reembolso de API
AI
Gate AI
O seu parceiro de IA conversacional tudo-em-um
Gate AI Bot
Utilize o Gate AI diretamente na sua aplicação social
GateClaw
Gate Lagosta Azul, pronto a usar
Gate for AI Agent
Infraestrutura de IA, Gate MCP, Skills e CLI
Gate Skills Hub
Mais de 10 mil competências
Do escritório à negociação, uma biblioteca de competências tudo-em-um torna a IA ainda mais útil
GateRouter
Escolha inteligentemente entre mais de 40 modelos de IA, com 0% de taxas adicionais
O Google lançou o modelo de código aberto Gemma 4 12B, que pode ser executado localmente com um portátil de consumo de 16GB
Google anuncia novamente a lacuna na família Gemma 4: um novo modelo de 12B de parâmetros que pode ser executado localmente em laptops de consumo com apenas 16GB de memória, com pontuações oficiais próximas ao modelo MoE de 26B, quase o dobro.
(Contexto anterior: Google lança nova aplicação de IA Dreambeans! Transforme sua rotina diária em uma "história em quadrinhos" de edição limitada)
(Informação adicional: Google investe fortemente em IA! Alphabet amplia financiamento de ações para 85 bilhões de dólares, recebendo um aporte de 10 bilhões de dólares da Berkshire Hathaway)
Em 3 de junho, o Google lançou o Gemma 4 12B, um modelo que não exige hardware de mais de 20 mil dólares, apenas um computador com 16GB de memória RAM ou VRAM para rodar localmente.
Lacuna na família Gemma 4
Em abril deste ano, o Google lançou quatro modelos na família Gemma 4: o E2B e E4B otimizados para dispositivos móveis, além do 26B MoE e 31B Dense voltados para servidores. Essa é uma linha de produtos que cobre desde dispositivos leves até a nuvem pesada, mas deixou uma lacuna clara no meio: a versão móvel é muito leve, enquanto acima de 26B requer hardware bastante potente, deixando quase nenhuma opção para laptops locais.
O modelo de 12B foi criado exatamente para preencher essa lacuna.
Para esclarecer, o 26B MoE é um "modelo de especialistas híbridos", onde MoE significa: o modelo chama especialistas neurais sob demanda, sem precisar ativar todos os parâmetros a cada inferência. Simplificando, essa arquitetura permite que o modelo ative apenas um subconjunto durante o cálculo, com cada token usando cerca de 4B de parâmetros. Mas o custo é que todos os 260 bilhões de parâmetros ainda precisam estar carregados na memória para manter a velocidade de roteamento e inferência, consumindo quase a mesma quantidade de memória de um modelo denso de tamanho equivalente.
O Dense de 31B é um "modelo denso" tradicional, que usa todos os parâmetros a cada inferência. Ou seja, não há economia, cada resposta é gerada com toda a força. Em comparação, o Gemma 4 12B usa aproximadamente 8,1GB de memória, cerca de metade do MoE de 26B.
Ao mesmo tempo, a família Gemma 4 adota a licença Apache 2.0, que permite uso comercial, modificação e redistribuição, uma licença de código aberto que permite aos desenvolvedores usar diretamente em seus produtos sem necessidade de solicitar permissão caso a caso.
"Quase tão forte"
No anúncio, o Google afirma que o Gemma 4 12B apresenta desempenho "quase tão forte" em várias métricas de benchmark, rivalizando com o modelo MoE de 26B de duas vezes o tamanho. As pontuações oficiais incluem GPQA Diamond (raciocínio científico de nível de pós-graduação), MMLU Pro (conhecimento multidisciplinar), DocVQA (perguntas e respostas visuais de documentos), entre outros, com números realmente próximos ao versão de 26B.
No entanto, há alguns pontos que merecem cautela ao interpretar esses números.
Primeiro, essas são pontuações oficiais autoavaliadas pelo Google, ainda não reproduzidas por terceiros independentes. As métricas são um ponto de partida, não o ponto final; na prática, a diferença de desempenho em cenários reais pode ser maior ou menor do que os números indicam. Segundo, "roda com 16GB" é tecnicamente verdadeiro, mas o uso real de memória é de cerca de 8,1GB. Para um laptop comum que mantém navegador e software de processamento de texto abertos, o espaço restante fica bastante apertado, não sendo acessível para todos rodarem sem problemas.
O Gemma 4 12B também é um modelo multimodal, usando uma arquitetura unificada sem codificador, o que significa que o mesmo modelo pode processar texto, imagens, áudio e vídeo diretamente, sem precisar de componentes adicionais de codificação.