Fundador da SemiAnalysis: Mercado de Inferência de IA Pode Ultrapassar o Petróleo, Tornando-se um dos Maiores Mercados Globalmente

No dia 1 de julho, Dylan Patel, fundador da SemiAnalysis, afirmou numa entrevista ao podcast "Training Data" da Sequoia Capital que a inferência de IA se tornará um dos maiores mercados a nível global, podendo ultrapassar o petróleo e representar vários pontos percentuais do PIB mundial. Ele acredita que o número e o valor das tarefas concluídas após cada iteração do modelo continuam a expandir-se a um ritmo mais rápido do que o crescimento do poder computacional, sugerindo que a escassez de poder computacional poderá persistir a longo prazo. Patel prevê que, até 2030, a procura combinada de poder computacional apenas da OpenAI e da Anthropic ultrapasse os 100 gigawatts; nos próximos 3 a 5 anos, o impacto dos centros de dados espaciais continuará a ser insignificante, mas até 2040, mais de metade do novo poder computacional poderá ser implantado no espaço. Ele indicou que a principal restrição reside no custo da energia terrestre e na capacidade de gerar eletricidade. Assim que a economia da implantação espacial superar a dos sistemas terrestres, a migração do poder computacional para o espaço tornar-se-á inevitável. Em relação ao design colaborativo de hardware e software, Patel observou que o aumento da eficiência da IA nos últimos três anos não veio principalmente do hardware, mas sim da otimização colaborativa a nível do modelo e entre camadas. Citou a DeepSeek como exemplo, afirmando que a forma do seu modelo especializado é especificamente otimizada para a arquitetura Hopper da NVIDIA, resultando num excelente desempenho no Hopper, mas fraco no TPU; o modelo da Anthropic é mais adequado para TPU, enquanto o modelo da OpenAI se inclina para a via GPU. Ele acredita que o chamado fosso da CUDA não é apenas sobre a própria CUDA, mas sim o ecossistema de modelos de código aberto que geralmente otimiza em torno da colaboração com GPU. Patel também mencionou que o forte apoio do CEO da NVIDIA, Jensen Huang, a empresas emergentes de computação em nuvem visa evitar que os grandes fornecedores de nuvem monopolizem o panorama do poder computacional e promover um mercado multipolar. Além disso, o sistema de benchmarking de inferência em tempo real InferenceX, construído pela equipa da SemiAnalysis, mostra que, com qualidade equivalente, os custos de inferência diminuíram aproximadamente 60 vezes ao ano, e a inteligência por watt melhorou cerca de 40 vezes.
DEEPSEEK-0,85%
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixado