torygreen

vip
Idade 2.8 Ano
Nível máximo 0
Ainda sem conteúdo
Eis a divisão do poder computacional de IA que poucos estão a interpretar corretamente.
O treino de fronteira está a concentrar-se mais a cada trimestre, milhares de GPUs que têm de estar num único local interligados. Mas o treino representa apenas 30% da procura em 2026. Os outros 70% são inferência, e executá-la num hyperscaler significa pagar por infraestrutura construída para a tarefa mais difícil para fazer a mais fácil.
Em redes distribuídas, essa mesma inferência pode ser 45-75% mais barata e, para quem dimensiona um orçamento de infraestrutura de IA, essa diferença é toda a história.
O
Ver original
post-image
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Tenho pensado nas recentes notícias do GLM 5.2 e no ângulo dos pesos abertos que toda a gente está a seguir, mas estão a perder um ângulo completamente diferente aqui.
Toda a gente está focada no facto de um laboratório chinês ter atingido desempenho de ponta e ter aberto o código, mas a parte que vale a pena considerar é como.
A ZAI e o resto dos laboratórios chineses foram cortados da Nvidia no início de 2025, por isso, presumivelmente, não têm tido H100s nem H200s diretamente desde então.
Eles ultrapassaram $128B num modelo treinado provavelmente em silício chinês que fica a poucos p
GLM-1,15%
Ver original
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
95% da capacidade de GPU empresarial está atualmente ociosa.
Esse número vem da Cast AI, que mediu 23.000 clusters de produção reais, não uma pesquisa genérica.
A utilização média era de 5% e isso está acontecendo no exato momento em que a Nvidia aumentou os preços do H200 em 15%, o primeiro aumento em 20 anos. O hardware que todos dizem ser escasso está na maior parte sem fazer nada.
Se você está tentando entender por que o cálculo parece impossível de obter, é por isso. Ninguém devolve uma alocação pela qual esperaram meses. Então a frota fica a 5%, cobrada por hora, e a escassez se al
Ver original
post-image
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Algumas grandes movimentações na política de IA da UE estão supostamente chegando, mas aqui está a realidade da infraestrutura com a qual eles estão trabalhando.
> Investimento em infraestrutura de IA soberana da UE em 2026: 12,6 bilhões de dólares.
> Capex de hyperscalers nos EUA no mesmo ano: 725 bilhões de dólares.
A Europa gastou seis anos construindo 19 Fábricas de IA e 14 supercomputadores e só a Amazon gastará mais que todo esse esforço em duas semanas este ano.
A maioria das equipes de IA europeias não usam infraestrutura europeia. Elas alugam de Virgínia e Iowa e pagam um prêmio de co
Ver original
post-image
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Não esperava que este número surgisse este ano.
O GitHub está a caminho de atingir 14 mil milhões de commits em 2026 até agora.
Isso é um aumento de 1 mil milhão em 2025.
Um aumento de 14 vezes num único ano e a maior parte dele não é escrita por humanos.
A carga tornou-se tão severa que a Microsoft, que possui e gere a segunda maior nuvem do mundo, teve que encaminhar o tráfego através da AWS para manter a plataforma online.
Nove incidentes de serviço só em maio.
A disponibilidade caiu para 88,4%.
Para todas as equipas de engenharia, fornecedores de infraestrutura e provedores d
Ver original
post-image
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
A receita da Nvidia é a prova de que a “computação agentic” não é uma teoria. Já está na demonstração de resultados.
$26B há quatro anos. 215,9 mil milhões de dólares no ano passado. Esse aumento de 8x aconteceu enquanto a maior parte da IA ainda estava sentada numa caixa de chat à espera de você fazer uma pergunta.
A parte importante não é apenas o crescimento. É que a Nvidia transformou a sua arquitetura na entrada não negociável para o roteiro de quase todos os outros. Laboratórios, nuvens, empresas. Logos diferentes na API, o mesmo silício por baixo. Quase cada dólar gasto em infraestr
Ver original
post-image
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Não esperava que o número de cinco anos da Goldman fosse tão grande.
Cinco hyperscalers estão projetados para gastar 5,3 trilhões de dólares em infraestrutura de IA entre 2025 e 2030. Em 2022, gastaram $162B combinados.
Este ano, estão no caminho para atingir 725 bilhões de dólares. Até 2027, os analistas projetam 1 trilhão de dólares em um único ano.
Para quem constrói produtos ou infraestrutura de IA fora dessas cinco balanças, essa trajetória é o número mais importante nas suas premissas de planejamento.
A diferença entre o que eles podem implantar e o que todos os outros podem ace
Ver original
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Todos previram que a IA assumiria primeiro o trabalho administrativo repetitivo. Os dados dizem algo diferente.
A tomada de decisão agora representa 28% da atividade de IA no local de trabalho.
O caso de uso número um não é automação. É julgamento.
As pessoas estão usando IA para analisar opções, pesar compensações e apoiar conclusões pelas quais são responsáveis, e essa mudança importa além da questão do mercado de trabalho.
Cargas de trabalho baseadas em julgamento funcionam continuamente, exigem mais contexto por sessão e não agrupam de forma eficiente.
Os requisitos de infraestru
Ver original
post-image
  • Recompensa
  • 1
  • Republicar
  • Partilhar
Millionairetasks:
Ótima oportunidade para todos estarem
Infraestrutura global de nuvem no primeiro trimestre de 2026. 129 bilhões de dólares em um único trimestre. Crescendo 35% ao ano.
O mercado está se expandindo rapidamente, mas a concentração não está mudando. AWS, Azure e Google Cloud mantiveram aproximadamente a mesma participação há dois anos que possuem hoje, mas a diferença absoluta entre eles e todos os outros é maior em termos de dólares do que nunca foi.
Essa é a parte que o gráfico de porcentagem não mostra. A fatia dos Outros não está crescendo para se tornar uma alternativa real. Ela permanece proporcionalmente igual enquanto os três
Ver original
post-image
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
A PJM gere a rede elétrica em 13 estados dos EUA e 65 milhões de pessoas. É o maior mercado de eletricidade por atacado competitivo do mundo.
O preço de liquidação do mercado de capacidade, a taxa que indica se o fornecimento futuro de energia pode atender à demanda, passou de $28,92 por MW em 2024 para $329,17 em 2026. Dois ciclos de leilão.
A demanda dos centros de dados foi identificada como o principal impulsionador. O leilão de 2027/2028 acabou sendo liquidado a $333,44, com a PJM atribuindo diretamente 5.100 MW do aumento de carga aos centros de dados.
Isso não é um choque de ofert
Ver original
post-image
  • Recompensa
  • 2
  • Republicar
  • Partilhar
DiveNate:
2026 GOGOGO 👊
Ver mais
Dois números deste gráfico.
Preço da API de IA: caiu 96% desde 2022.
Capex de hyperscaler: aumentou 12 vezes no mesmo período.
A maioria das pessoas vê o primeiro número e chama-lhe democratização, mas ninguém está a construir uma estratégia em torno do segundo.
Não é uma coincidência. É uma jogada de captura estrutural.
Cada startup de IA que celebra modelos baratos está a correr em computação que não possui, numa infraestrutura que não consegue replicar, controlada por três empresas.
IA soberana começa com infraestrutura soberana. Todo o resto é apenas uma dependência com preço m
Ver original
post-image
  • Recompensa
  • 1
  • Republicar
  • Partilhar
Yuhuan:
gsgsgshsokzkzkzkxhxj
A coisa que a sexta-feira revelou não é que os governos podem desligar modelos de IA.
É que toda a base de utilizadores global dos modelos mais capazes do mundo está por trás de uma única decisão operacional de uma única empresa respondendo a uma única diretiva. Sem redundância ou aviso.
Três das maiores empresas de IA controlam atualmente 88% do acesso à IA de fronteira e uma superfície de conformidade para tudo isso.
O que a sexta-feira tornou visível é que, quando o acesso ao cálculo e ao modelo está dentro de um punhado de empresas, toda a pilha herda o seu único ponto de falha. Isso
Ver original
post-image
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Em 2024, o mapa de computação de IA tinha duas superpotências. EUA com 53,7 GW, China com 31,9 GW.
Em 2026, a China está com 2,5 GW.
Isso é uma demolição controlada da capacidade de infraestrutura de IA de uma nação através de política de exportação. Sem bombas, sem sanções, apenas regras de chips.
O que isso prova é que a computação agora é uma arma geopolítica. Qualquer país que não possui sua infraestrutura não quer descobrir como é estar na linha de recebedor dessa arma.
A questão não é se a computação descentralizada vence. É se ela chega antes da próxima decisão de política reest
Ver original
post-image
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
A maior oferta pública inicial de tecnologia dos anos 2000 foi a Visa, com 28 bilhões de dólares. A maior dos anos 2010 foi a Alibaba, com 168 bilhões de dólares. Aproximadamente 6x por década.
Agora, estenda a linha. OpenAI e Anthropic já estão em $1T antes mesmo de serem listadas.
Se somar os maiores estreias tecnológicas dos últimos 25 anos. Alibaba, Facebook, Uber, Rivian, Snowflake, Palantir, Cerebras, CoreWeave, todos eles. Você chega a aproximadamente 800 bilhões de dólares.
OpenAI + Anthropic sozinhas valem quase 2 trilhões de dólares. Ainda privadas. 2,5x maiores do que um quarto de s
Ver original
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Durante a maior parte da história, o capital crescia através de máquinas.
Agora, cresce através da cognição.
Uma startup pode despertar com o equivalente a um milhão de analistas, investigadores, programadores e estrategistas a trabalhar em paralelo com um custo marginal quase zero.
A revolução da IA é diferente de qualquer revolução técnica anterior.
Ver original
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
não se pode fazer uma emissão aberta e tratar a parte aberta como opcional uma vez que o dinheiro aparece
o julgamento começou com uma questão: pode-se criar uma organização sem fins lucrativos, chamar a OpenAI de sua missão, atrair 10 anos de engenheiros motivados pela missão e capital de doações com essa promessa, e depois converter para uma estrutura com limite de lucro e chamá-la de uma evolução?
elon deixou a OpenAI em 2018. os danos que $130b está pedindo vão para a organização sem fins lucrativos. seja qual for a sua opinião sobre ele como litigante, a questão que o caso força a entrar
Ver original
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
a nvidia é agora maior do que toda a economia do Japão e a sua conta de IA é a razão
cada dólar que você gasta em IA agora passa por chips de uma única empresa, em três nuvens que os revendem com uma margem
> startups de IA queimam cerca de 80% do seu capital levantado apenas para alugar computação
> já vi equipes em estágio inicial pagando 700 mil dólares por mês a um único fornecedor de chips
> centros de dados operam com 12-18% de capacidade enquanto a sua conta aumenta a cada trimestre
toda a indústria acabou de concordar em ficar numa fila e entregar dinheiro ao mesmo posto de pedágio
Ver original
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
a multidão de que acredita que a IA está sobreconstruída nunca tentou comprar um h100 neste trimestre
passar uma semana tentando comprar h100s agora significa: compromisso de 12 meses na aws (utilização 24/7 bloqueada antes de você ver um único gpu), lista de espera no gcp sem ETA, lambda e coreweave ambos esgotados, todos os provedores menores dando a mesma resposta em palavras diferentes
a construção de hyperscalers é medida em anos, as escassezes de CPU estão parando as GPUs que existem, e a demanda continua crescendo enquanto os hyperscalers solicitam permissões
equipes de IA em está
Ver original
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Aparentemente, a Nvidia visitou discretamente empresas de equipamentos elétricos coreanas, pedindo-lhes que redesenhassem a infraestrutura de centros de dados em torno de uma arquitetura de 800V DC.
Isso é uma admissão de que o modelo de IA centralizado atingiu uma parede física, e que cada nova geração de chips agora exige uma retrofit de subestação em algum lugar na cadeia.
Os centros de dados globais já operam com uma utilização de 12 a 18 por cento.
Fazendas de mineração de criptomoedas têm GPUs poderosas paradas, desde a fusão do Ethereum.
Sistemas de jogos para consumidores com 4
ETH-5,33%
Ver original
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
muitas pessoas ainda estão arquitetando em torno de uma dependência de computação que saiu de cena
qwen3 32b, por exemplo, está ao vivo em GPUs comunitárias distribuídas neste momento, paralelismo de pipeline rodando entre nós sem que um único operador controle, inferência sem permissão pela internet aberta
três camadas, todas abertas: pesos abertos (Alibaba os lançou), computação sem permissão (hardware comunitário, sem custódia), transporte aberto (sem cluster privado, sem porta de API). propriedade não se aplica a nenhuma delas
o modelo mental de que inferência compatível com frontier
Ver original
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar