Futuros
Acesse centenas de contratos perpétuos
CFD
Ouro
Plataforma única para ativos tradicionais globais
Opções
Hot
Negocie opções vanilla no estilo europeu
Conta unificada
Maximize sua eficiência de capital
Negociação demo
Introdução à negociação de futuros
Prepare-se para sua negociação de futuros
Eventos de futuros
Participe de eventos e ganhe recompensas
Negociação demo
Use fundos virtuais para experimentar negociações sem riscos
Lançamento
CandyDrop
Colete candies para ganhar airdrops
Launchpool
Staking rápido, ganhe novos tokens em potencial
HODLer Airdrop
Possua GT em hold e ganhe airdrops massivos de graça
Pre-IPOs
Desbloqueie o acesso completo a IPO de ações globais
Pontos Alpha
Negocie on-chain e receba airdrops
Pontos de futuros
Ganhe pontos de futuros e colete recompensas em airdrop
Investimento
Simple Earn
Ganhe juros com tokens ociosos
Autoinvestimento
Invista automaticamente regularmente
Investimento duplo
Lucre com a volatilidade do mercado
Soft Staking
Ganhe recompensas com stakings flexíveis
Empréstimo de criptomoedas
0 Fees
Penhore uma criptomoeda para pegar outra emprestado
Centro de empréstimos
Centro de empréstimos integrado
Promoções
Centro de atividade
Participe de atividades e ganhe recompensas
Indicação
20 USDT
Convide amigos para recompensas de ind.
Programa de afiliados
Ganhe recomp. de comissão exclusivas
Gate Booster
Aumente a influência e ganhe airdrops
Anúncio
Atualizações na plataforma em tempo real
Blog da Gate
Artigos do setor de criptomoedas
Serviços VIP
Grandes Descontos nas Taxas
Gerenciamento de ativos
Solução completa de gerenciamento de ativos
Institucional
Soluções de ativos digitais para empresas
Desenvolvedores (API)
Conecta-se ao ecossistema de aplicativos da Gate
Transferência Bancária OTC
Deposite e retire moedas fiat
Programa de corretoras
Mecanismos de grandes descontos via API
AI
Gate AI
Seu parceiro de IA conversacional para todas as horas
Gate AI Bot
Use o Gate AI diretamente no seu aplicativo social
GateClaw
Gate Blue Lobster, pronto para usar
Gate for AI Agent
Infraestrutura de IA, Gate MCP, Skills e CLI
Gate Skills Hub
10K+ habilidades
Do escritório à negociação: um hub completo de habilidades para turbinar o uso da IA
GateRouter
Escolha inteligentemente entre mais de 40 modelos de IA, com 0% de taxas extras
Uma caixa NVIDIA de $2999, como ela pode me ajudar a ganhar $22.000 a mais em um ano?
Este artigo do autor @w1nklerr desmonta como ele usou o NVIDIA DGX Spark de $2.999 para substituir uma conta mensal de GPU na nuvem de $1.900. No primeiro ano, ele mantém cerca de $22.000 de "lucro de fuga" dentro do seu próprio negócio. O conteúdo cobre especificações, comparação de custos, pilha de software, comandos de implementação e públicos-alvo.
(Resumindo: Os resultados financeiros do Nvidia GeForce Q1 são incríveis! Receita de 81,6 bilhões de dólares, recorde, Jensen Huang comemora "Era da IA Agentic chegando", dividendos aumentaram 24 vezes)
(Complemento: Jensen Huang da Nvidia: o mercado chinês eventualmente abrirá para chips de IA americanos)
Índice do artigo
Alternar
Há meses, ninguém me contou isso. Agora eu conto, para que você não perca um ano inteiro como eu. Vamos começar pelo número que me deixou furioso. No último trimestre, meus gastos com GPU na nuvem eram fixos em $1.900 por mês.
Eu trabalhava com projetos pagos de IA: ajuste fino de modelos open source, hospedagem de um assistente de 70B, processamento em lote de muitos arquivos — trabalhos que uma GPU de $2.000 simplesmente rejeitaria, porque o modelo não cabe na memória.
Então, eu alugava capacidade por hora. Uma semana, A100; na outra, H100. Uma noite, olhando a conta, percebi de repente: Eu cobro do cliente pelo trabalho, e quase $2.000 por mês vão direto para uma empresa de aluguel de máquinas. Isso não é custo, é lucro que sai pela porta da frente.
Alguns dias depois, alguém no Discord postou uma foto: uma coisa do tamanho de um romance encadernado, ao lado do monitor. A legenda dizia: "Mate minha conta na nuvem, posso rodar um modelo 120B na mesa, em dois meses recupero o investimento."
Era um DGX Spark. NVIDIA. A mesma insígnia DGX — que antes significava gastar $250.000, em um rack de servidor — agora foi compactada em um desktop.
Naquela semana, eu comprei. Aqui está tudo que aprendi.
1. O que exatamente é isso
Quando a maioria ouve "supercomputador de IA", pensa em uma fileira de servidores zumbindo. A Nvidia passou o ano de 2025 desmontando essa imagem: em janeiro, na CES, anunciaram sob o nome "Project DIGITS"; em março, no GTC, renomearam para DGX Spark; em outubro, entregaram de verdade ao comprador. Jensen Huang na abertura do evento explicou:
Promovido como o menor supercomputador de IA do mundo, capaz de rodar modelos de 200B de parâmetros a partir de uma tomada doméstica comum. A frase que mais me impressionou foi: "IA será a norma em todas as indústrias e aplicações."
Deixando de lado a estratégia de marketing, as especificações reais do chip são:
Especificações do DGX Spark
| Item | | --- | | Especificação | | --- | --- | | Chip | NVIDIA GB10 Grace Blackwell Superchip | | Throughput de IA | 1 PFLOP (um quatrilhão de operações FP4 por segundo) | | CPU | 20 núcleos ARM (Grace) | | GPU | Blackwell, aproximadamente equivalente a uma GPU RTX 5070 | | Memória | 128GB LPDDR5x, CPU + GPU compartilhados | | Armazenamento | 4TB Gen5 NVMe, criptografado automaticamente | | Rede | ConnectX-7 — duas unidades conectadas como uma só | | Consumo | 150–240W sob carga máxima | | Tamanho | 150 × 150 × 50mm, 1,2kg — o tamanho de um livro de bolso | | Preço | $2.999 (preço de lançamento) |
Deixe o número petaflop de lado por um momento. A especificação que realmente muda sua vida é a Memória Unificada de 128GB.
Um RTX 4090 oferece 24GB de VRAM. 5090, 32GB. Quando o modelo é maior que a VRAM, ele simplesmente não carrega — CUDA dá out-of-memory, e você precisa alugar outra máquina.
O Spark oferece 128GB, então consegue carregar um modelo que uma GPU de $2.000 nem abre. Uma única máquina pode rodar até 200B de parâmetros. Duas conectadas via ConnectX-7, você roda 405B na mesa.
Não é o hardware mais caro que você consegue comprar. É o hardware que realmente consegue acomodar "modelos que valem a pena rodar".
2. A parte que me deixou furioso
Essa é a realidade do "trabalho local de IA", o valor que você gasta na nuvem todo mês:
Você alugando coisas vs gastos mensais
| Item | | --- | Gasto mensal | | --- | --- | | A100 80GB (desenvolvimento parcial) | $600–1.200 | | H100 (ajuste fino) | $1.000–2.500 | | Hospedagem de inferência 70B | $300–900 | | Aquelas instâncias que você esquece de desligar | uma surpresa assustadora | | Um freelancer/Construtor de IA normal | $1.500–3.000 |
E o Spark rodando a mesma carga de trabalho:
| Item | | --- | Custo | | --- | --- | | Hardware (que você possui) | $2.999 uma vez | | Energia, cerca de 200W | $8–15 por mês | | Aluguel na nuvem | $0 | | Gasto mensal de operação | cerca de $10 |
Para alguém acostumado a gastar $1.900 na nuvem por mês, em aproximadamente 1,6 meses recupera o valor da máquina inteira.
Depois, aquele $1.890 que ia para o aluguel na nuvem vira meu lucro bruto — ainda trabalhando com o mesmo cliente. No primeiro ano, cerca de $22.000, trazidos do data center de terceiros para dentro do meu próprio negócio.
E ela nunca dorme, não tem limite de velocidade, e os dados na mesa nunca saíram do ambiente.
3. O que roda lá em cima, por que seu código quase não precisa de mudanças
O Spark inicia com DGX OS — a versão do Ubuntu própria da Nvidia — que já vem com toda a pilha de IA: CUDA, além da mesma biblioteca que roda nos data centers DGX.
Por ser baseado em CUDA puro, o ecossistema open source funciona de cara: Ollama, vLLM, llama.cpp.
Se você já trabalha com endpoints na nuvem, basta uma linha para migrar:
O mesmo código, o mesmo JSON, o mesmo comportamento. A única diferença é que não há cobrança, nem dados saindo do prédio.
O que um único 128GB pode rodar
| Modelo | | --- | Tamanho | Cabe? | Para que serve | | --- | --- | --- | --- | | Llama 3.3 70B | 70B | Full BF16 | Tarefas pesadas de assistente | | Qwen 3 (versão grande) | 30–110B | Cabe sim | Multilíngue, programação | | DeepSeek-class | Até 200B | Versão quantizada | Inferência, ciclo de agente | | FLUX.1 | — | Cabe sim | Geração de imagens, localmente | | 405B (duas conectadas) | 405B | Conectado | Nível Frontier, on-premises |
GPU de consumo comum chega ao limite por volta de um modelo de 30B otimizado. Spark consegue rodar 70B em "precisão total" e até 200B. Essa diferença é toda a justificativa para ter uma Spark.
4. Montar é tão rápido que chega a ser até constrangedor
Quer uma interface web estilo ChatGPT, totalmente rodando no seu hardware? É só um container:
Abra localhost:3000 e terá uma interface de chat privada, rodando com modelos do nível frontier — sem chave, sem plano, sem dados saindo do ambiente.
5. Onde o dinheiro realmente aparece
O segredo não é "quanto se consegue economizar na papelada". O segredo é: quando um modelo de 70B custa zero por chamada, certas coisas deixam de ser "decisões".
A Nvidia entregou unidades iniciais para Ollama, OpenAI, SpaceX, laboratórios de robótica universitários e estúdios de arte IA — mas, para quem gerencia um negócio, a jogada é mais simples:
Se você vende serviços de IA
Se você lida com dados sensíveis (uso silencioso de alto impacto)
Na Spark, esses dados nunca saem da rede. E, na sua máquina própria, sem ToS que te controlem.
Mudança de mentalidade
O preço na nuvem ensina "economizar". Você pensa duas vezes antes de fazer o agente rodar em loop, antes de reprocessar toda a base de dados, antes de ajustar finamente por intuição.
Depois de ter a máquina, essa hesitação desaparece — e o dinheiro de verdade geralmente está escondido nessa hesitação.
6. Preciso ser honesto com você
Não é um milagre. Quem diz que isso "destrói os data centers" está querendo vender alguma coisa.
Pontos fortes:
Pontos que não se consegue
Conclusão honesta:
Se você já gasta mais de $1.000 por mês em nuvem por causa de modelos open source grandes, essa é uma das formas mais rápidas de recuperar o investimento na IA atualmente.
Se você só conversa de vez em quando com um modelo de 7B, uma máquina barata ou seu GPU atual ainda é a melhor escolha.
Escolha o hardware de acordo com o tamanho do trabalho, não pelo hype.
7. Lista completa de ferramentas
| Categoria | | --- | Conteúdo | | --- | --- | | Hardware | NVIDIA DGX Spark — $2.999 de uma só vez OEM: ASUS, Dell, HP, Lenovo, Acer, MSI, GIGABYTE | | Sistema Operacional | NVIDIA DGX OS (baseado em Ubuntu), com toda a pilha de IA da Nvidia, CUDA, NIM, NeMo pré-instalados | | Runtime | Ollama / vLLM / llama.cpp — gratuito, open source | | UI | Open WebUI — interface local estilo ChatGPT | | Modelos | Llama 3.3 70B, Qwen 3, DeepSeek, FLUX.1 disponíveis via Hugging Face / Ollama gratuitamente | | Expansão | Duas unidades conectadas via ConnectX-7, até 405B de parâmetros | | Consumo | Cerca de $8–15 de eletricidade por mês | | Privacidade | Nunca sai da sua rede, ponto final |
Custos recorrentes: alguns dólares de eletricidade. E isso é toda a conta.
Por que agora, e não mais tarde
A Nvidia transformou um DGX de $250.000 em um desktop, não por benevolência.
Eles querem que a próxima geração de IA seja construída em seus chips, localmente, por "quanto mais, melhor" — por isso, estabeleceram o preço de entrada em $2.999, e Jensen Huang entregou pessoalmente unidades para Musk e Altman, reforçando a mensagem.
Hoje, Dell, HP, ASUS e Lenovo lançam seus próprios caixas GB10, enquanto a camada de software — Ollama, vLLM, pilha CUDA — quase toda semana ajusta para esses chips.
Ao mesmo tempo, a GPU na nuvem não fica mais barata, as limitações de taxa aumentam, e "para onde nossos dados realmente vão" se torna uma questão que os clientes perguntam antes de assinar.
Quem colocar IA na sua mesa até 2026, em 2028 estará muito à frente na curva.
Uma máquina do tamanho de um livro de bolso. Um petaflop completo. Um modelo de 70B que é "s seu, e de mais ninguém". Custando cerca de dez dólares por mês para operar — e deixando de gastar os $1.900 que saem mensalmente do seu negócio.
Essa é toda a troca.
Só queria ter feito essa troca um ano antes.