Fundador da SemiAnalysis: Mercado de Inferência de IA Pode Superar o Petróleo, Tornando-se um dos Maiores Mercados Globais

Em 1 de julho, Dylan Patel, fundador da SemiAnalysis, afirmou numa entrevista ao podcast "Training Data" da Sequoia Capital que a inferência de IA se tornará um dos maiores mercados a nível global, podendo ultrapassar o petróleo e representar vários pontos percentuais do PIB mundial. Ele acredita que o número e o valor das tarefas concluídas após cada iteração do modelo continuam a expandir-se a um ritmo mais rápido do que o crescimento do poder computacional, sugerindo que uma escassez de poder computacional poderá persistir a longo prazo. Patel prevê que, até 2030, a procura combinada de poder computacional apenas da OpenAI e da Anthropic excederá os 100 gigawatts; nos próximos 3 a 5 anos, o impacto dos centros de dados espaciais permanecerá negligenciável, mas até 2040, mais de metade do novo poder computacional poderá ser implantado no espaço. Indicou que a restrição central reside no custo da energia terrestre e na capacidade de gerar eletricidade. Assim que a economia da implantação espacial ultrapassar a dos sistemas terrestres, a migração do poder computacional para o espaço tornar-se-á inevitável. Em relação ao design colaborativo de hardware e software, Patel observou que o aumento da eficiência da IA nos últimos três anos não veio principalmente do hardware, mas sim da otimização colaborativa ao nível do modelo e entre camadas. Citou a DeepSeek como exemplo, afirmando que a forma do seu modelo especializado é otimizada especificamente para a arquitetura Hopper da NVIDIA, resultando num excelente desempenho no Hopper, mas num desempenho fraco na TPU; o modelo da Anthropic é mais adequado para a TPU, enquanto o modelo da OpenAI se inclina para a rota da GPU. Ele acredita que o chamado fosso da CUDA não é apenas sobre a CUDA em si, mas sim o ecossistema de modelos de código aberto que geralmente otimiza em torno da colaboração com GPUs. Patel mencionou também que o forte apoio do CEO da NVIDIA, Jensen Huang, às empresas emergentes de computação em nuvem visa evitar que os grandes fornecedores de cloud monopolizem o panorama do poder computacional e promover um mercado multipolar. Além disso, o sistema de benchmarking de inferência em tempo real InferenceX, construído pela equipa da SemiAnalysis, mostra que, sob qualidade equivalente, os custos de inferência diminuíram cerca de 60 vezes ao ano, e a inteligência por watt melhorou cerca de 40 vezes.
DEEPSEEK-4,94%
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixado