Técnicos da OpenAI criticam recomendações de hardware do V4: Uma mudança surpreendente em relação ao impacto na indústria do V3

robot
Geração de resumo em curso

De acordo com a monitorização pela Beating, o técnico da OpenAI Clive Chan afirmou que o relatório técnico geral do V4 permanece de primeira linha, mas as recomendações de hardware para os fabricantes de chips são “surpreendentemente medíocres e até erradas”, contrastando fortemente com o V3.
A secção de hardware do relatório do V3 apresentava uma sessão de perguntas e respostas que foi a discussão mais popular na conferência académica ISCA, com recomendações específicas para padrões industriais em desenvolvimento para interconexões, enquanto o V4 tornou-se muito mais vago.
Chan levantou vários pontos de discórdia.
Relativamente ao consumo de energia, o relatório afirma que a otimização de software permite que os chips executem computação, armazenamento e comunicação em plena capacidade simultaneamente, sugerindo que os fabricantes de chips reservem mais margem de potência.
Chan argumenta que isto é “contraproducente”: o consumo total de energia de um chip é limitado por processos físicos, e reservar mais margem de potência significaria diminuir a frequência de operação, reduzindo assim o poder computacional.
No que diz respeito à transmissão de dados entre GPUs, o relatório sugere que as GPUs devem ler ativamente os dados (pull) em vez de os receberem empurrados, devido ao elevado overhead das notificações push.
Chan questiona este julgamento, acreditando que o pull é na verdade mais lento e que as capacidades de processamento de dados das placas de rede deveriam ser melhoradas.
No entanto, os dois podem não estar a discutir o mesmo nível de questões: o relatório aborda o overhead do mecanismo de notificação, enquanto Chan está preocupado com a latência da própria transmissão.
Relativamente às funções de ativação, o relatório recomenda substituir o SwiGLU por funções mais simples para reduzir a carga computacional, mas Chan acredita que isso é desnecessário, uma vez que o Sonic MoE já demonstrou que o desempenho ótimo pode ser alcançado usando SwiGLU.
Chan suspeita que o DeepSeek possa ter “intencionalmente minimizado esta secção”.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar