L'analyse de Beating met en évidence la critique de Clive Chan concernant les directives matérielles vagues de V4, en contraste avec les interconnexions détaillées de V3, et discute de l'espace de puissance disponible, du tirage vs poussée du GPU, du SwiGLU vs des activations plus simples, avec des soupçons que DeepSeek a minimisé cette section.Résumé : Cet article passe en revue les notes de Beating sur le rapport technique de V4 d'OpenAI, en se concentrant sur la critique de Clive Chan concernant la guidance matérielle plus vague de V4 par rapport aux recommandations concrètes d'interconnexion de V3. Il aborde l'espace de puissance par rapport aux limites physiques, le débat sur le transfert de données GPU (tirage vs poussée), et l'engagement avec les choix de fonctions d'activation, y compris les préoccupations que DeepSeek a minimisé cette section.

AirdropBlackHole

2026-04-24 09:21:51

Création du résumé en cours

Selon la surveillance de Beating, le technicien d’OpenAI Clive Chan a déclaré que le rapport technique global V4 reste de premier ordre, mais que les recommandations matérielles pour les fabricants de puces sont “surprenamment médiocres et même erronées”, contrastant fortement avec la V3. La section matérielle du rapport V3 comportait une séance de questions-réponses qui était la discussion la plus populaire lors de la conférence académique ISCA, avec des recommandations spécifiques aux normes industrielles en cours de développement pour les interconnexions, alors que la V4 est devenue beaucoup plus vague. Chan a soulevé plusieurs points de discorde. En ce qui concerne la consommation d’énergie, le rapport affirme que l’optimisation logicielle permet aux puces de faire fonctionner le calcul, le stockage et la communication à pleine capacité simultanément, suggérant que les fabricants de puces réservent plus de marge de puissance. Chan soutient que cela est “contre-productif” : la consommation totale d’énergie d’une puce est limitée par des processus physiques, et réserver plus de marge de puissance signifierait réduire la fréquence de fonctionnement, ce qui diminuerait la puissance de calcul. Sur le sujet de la transmission de données entre GPU, le rapport suggère que les GPU devraient lire activement les données (pull) plutôt que de les recevoir par poussée, en raison du coût élevé des notifications push. Chan remet en question ce jugement, croyant que le pull est en réalité plus lent et que les capacités de traitement des données des cartes réseau devraient être améliorées. Cependant, les deux ne discutent peut-être pas du même niveau de problèmes : le rapport traite de la surcharge du mécanisme de notification, tandis que Chan s’inquiète de la latence de la transmission elle-même. Concernant les fonctions d’activation, le rapport recommande de remplacer SwiGLU par des fonctions plus simples pour réduire la charge de calcul, mais Chan pense que cela est inutile, car Sonic MoE a déjà démontré qu’une performance optimale peut être atteinte en utilisant SwiGLU. Chan suspecte que DeepSeek a “délibérément minimisé cette section”.

Voir l'original

Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.

Récompense
J'aime
Commentaire
Reposter
Partager

Commentaire

Ajouter un commentaire

Aucun commentaire

Sujets populaires
Afficher plus
#
WCTCTradingKingPK
213.15K Popularité
#
CryptoMarketSeesVolatility
270.25K Popularité
#
IsraelStrikesIranBTCPlunges
32.7K Popularité
#
rsETHAttackUpdate
92.6K Popularité
#
US-IranTalksStall
359.02K Popularité

Épingler

Les techniciens d'OpenAI critiquent les recommandations matérielles de V4 : un changement surprenant par rapport à l'impact industriel de V3

Sujets populaires

WCTCTradingKingPK

CryptoMarketSeesVolatility

IsraelStrikesIranBTCPlunges

rsETHAttackUpdate

US-IranTalksStall

Épingler