Futures
Accédez à des centaines de contrats perpétuels
CFD
Or
Une plateforme pour les actifs mondiaux
Options
Hot
Tradez des options classiques de style européen
Compte unifié
Maximiser l'efficacité de votre capital
Trading démo
Introduction au trading futures
Préparez-vous à trader des contrats futurs
Événements futures
Participez aux événements et gagnez
Demo Trading
Utiliser des fonds virtuels pour faire l'expérience du trading sans risque
CFD
Produits dérivés CFD sur actions américaines
US Stocks
Accédez à de véritables actions et ETF américains
HK Stocks
Tradez des actions des actions de qualité cotées à Hong Kong
Actions coréennes
SK Hynix
Tradez de véritables actions coréennes et investissez dans les actifs les plus populaires
Futures sur actions
Effet de levier élevé, trading 24h/24 et 7j/7
Actions tokenisées
Adossé à de véritables actions
IPO Access
Accédez à l'intégralité des introductions en bourse mondiales
GUSD
Mint GUSD pour des rendements de Treasury RWA
Activités boursières
Tradez des actions populaires et débloquez des airdrops généreux
Lancer
CandyDrop
Collecte des candies pour obtenir des airdrops
Launchpool
Staking rapide, Gagnez de potentiels nouveaux jetons
HODLer Airdrop
Conservez des GT et recevez d'énormes airdrops gratuitement
IPO Access
Accédez à l'intégralité des introductions en bourse mondiales
Points Alpha
Tradez on-chain et gagnez des airdrops
Points Futures
Gagnez des points Futures et réclamez vos récompenses d’airdrop.
Investissement
Simple Earn
Gagner des intérêts avec des jetons inutilisés
Investissement automatique
Auto-invest régulier
Double investissement
Profitez de la volatilité du marché
Staking souple
Gagnez des récompenses grâce au staking flexible
Prêt Crypto
0 Fees
Mettre en gage un crypto pour en emprunter une autre
Centre de prêts
Centre de prêts intégré
Promotions
Centre d'activités
Participez et gagnez des récompenses
Parrainage
20 USDT
Invitez des amis et gagnez des récompenses
Programme d'affiliation
Obtenez des commissions exclusives
Gate Booster
Développez votre influence et gagnez des airdrops
Annoncement
Mises à jour en temps réel
Blog Gate
Articles sur le secteur de la crypto
AI
Gate AI
Votre assistant IA polyvalent pour toutes vos conversations
Gate AI Bot
Utilisez Gate AI directement dans votre application sociale
GateClaw
Gate Blue Lobster, prêt à l’emploi
Gate for AI Agent
Infrastructure IA, Gate MCP, Skills et CLI
Gate Skills Hub
+10K compétences
De la bureautique au trading, une bibliothèque de compétences tout-en-un pour exploiter pleinement l’IA
Claude Code a supprimé 80% des prompts d'un seul coup, Anthropic a donné l'exemple avec Fable 5 : la « réduction des coûts » dans l'industrie de l'IA ne fait que commencer.
这是正在发生的现实。根据最新数据显示,Anthropic 自家公司花在算力上的钱,也已经达到其薪资支出的 2.3 倍。按照一名高级工程师 22.4 万美元的完全成本来算,Anthropic 每位工程师每年对应的算力支出约为 51.5 万美元。也就是说:人还没模型贵。
C’est la réalité qui se produit. Selon les dernières données, les dépenses d’Anthropic en puissance de calcul ont déjà atteint 2,3 fois ses dépenses salariales. En prenant le coût total d’un ingénieur senior de 224 000 dollars, chaque ingénieur d’Anthropic représente environ 515 000 dollars de dépenses de calcul par an. Autrement dit : les humains coûtent moins cher que les modèles.
在这种账单面前,连 Claude 自己也不得不开始省 token 了。
Face à ces factures, même Claude doit commencer à économiser les tokens.
Claude Code:烧 token 换“我很高产”的错觉
Claude Code : brûler des tokens pour l’illusion d’« être très productif »
最近,业界又有了一个新词:Token Apocalypse(Token 末日)。
Récemment, l’industrie a inventé un nouveau terme : Token Apocalypse (l’Apocalypse des tokens).
从 token maxing 到 token apocalypse,预示着 AI 行业真的发生了一种非常大的范式转变。今年三四月份,大家还在炫耀自己用了多少 token,甚至把它当成一种排行榜。但使用 AI 并不自动意味着省钱,于是大家开始更强调单个 token 的成本。
De « token maxing » à « token apocalypse », cela annonce un très grand changement de paradigme dans l’industrie de l’IA. En mars-avril de cette année, les gens se vantaient encore du nombre de tokens qu’ils utilisaient, le considérant même comme un classement. Mais utiliser l’IA ne signifie pas automatiquement économiser de l’argent, on a donc commencé à mettre davantage l’accent sur le coût individuel du token.
更微妙的是,大模型还在扩大很多原本根本不需要用 AI 的工作。我们现在 PDF 不想自己读了,长文不想自己看了,所有东西都要让 AI 总结。或者把这些东西用 AI 转成幻灯片,再丢给别人,对方可能再用 AI 读这些幻灯片......AI 像是在给一些本来就很虚的工作再强行注入一层价值,同时也把账单悄悄推高。
Plus subtilement, les grands modèles étendent également de nombreux travaux qui n’avaient fondamentalement pas besoin d’IA. Aujourd’hui, nous ne voulons plus lire les PDF nous-mêmes, ni les longs textes, tout doit être résumé par l’IA. Ou bien on transforme ces contenus en diapositives avec l’IA, on les envoie à quelqu’un d’autre, qui les lira peut-être à nouveau avec l’IA… L’IA injecte de force une valeur ajoutée à des tâches déjà vaporeuses, tout en faisant monter discrètement la facture.
如今,成本失控已成常态。亚马逊、Adobe、Atlassian、花旗集团等公司开始对 AI 使用实施严格管控:
Aujourd’hui, la perte de contrôle des coûts est devenue monnaie courante. Des entreprises comme Amazon, Adobe, Atlassian, Citigroup ont commencé à imposer des contrôles stricts sur l’utilisation de l’IA :
限制模型等级:一些公司的员工被禁止使用 Claude Opus 等高端模型,被迫降级到更便宜的版本;
设定个人限额:Uber 为每位工程师每月设定了 1500 美元的 token 上限;
彻底停用权限:花旗银行等机构已完全限制对高级 AI 工具的访问,未达使用目标的员工甚至会被撤销企业账户。在此之前,Uber 的 CTO 曾坦言,公司在几个月内就用完了全年 AI 预算。Walmart 最近也停止了一些工具的使用。
Limitation du niveau de modèle : les employés de certaines entreprises sont interdits d’utiliser des modèles haut de gamme comme Claude Opus, et sont contraints de passer à des versions moins chères.
Fixation de limites individuelles : Uber a fixé un plafond de 1 500 dollars par mois et par ingénieur pour les tokens.
Suppression totale des autorisations : des institutions comme Citibank ont complètement restreint l’accès aux outils d’IA avancés, et les employés qui n’atteignent pas leurs objectifs d’utilisation peuvent même se voir retirer leur compte professionnel. Avant cela, le CTO d’Uber avait admis que l’entreprise avait épuisé son budget AI annuel en quelques mois. Walmart a également récemment cessé d’utiliser certains outils.
大公司要么在四处找省钱办法,要么直接给 token 浪费踩急刹车。因此员工收到的信息极其矛盾:一边是“AI 能让你效率翻 100 倍,必须用”,一边是“别再把公司用破产了”。
Les grandes entreprises soit cherchent partout des moyens d’économiser, soit freinent brusquement le gaspillage de tokens. Les employés reçoivent donc des messages extrêmement contradictoires : d’un côté « l’IA peut décupler ton efficacité, tu dois l’utiliser », de l’autre « ne mets plus l’entreprise en faillite ».
这也是 AI 工具第一轮普及里最典型的问题:工具被推出时,并没有足够护栏来阻止公司在大语言模型上花掉数百万美元,也没有机制提醒团队 token 正在迅速烧光。不管是聊天机器人还是编码工具,很多产品先把“能用起来”摆在第一位,成本治理、使用配额、模型分级和上下文管理都被放到了后面。
C’est aussi le problème le plus typique de la première vague d’adoption des outils d’IA : lorsque les outils sont lancés, il n’y a pas suffisamment de garde-fous pour empêcher les entreprises de dépenser des millions de dollars en grands modèles de langage, ni de mécanismes pour alerter les équipes que les tokens se consument rapidement. Qu’il s’agisse de chatbots ou d’outils de codage, de nombreux produits placent d’abord « la possibilité d’utilisation » en priorité, tandis que la gestion des coûts, les quotas d’utilisation, la classification des modèles et la gestion du contexte sont relégués au second plan.
但 Claude Code 本质上不是效率工具,而是一个营销工具。
Mais Claude Code n’est pas fondamentalement un outil de productivité, c’est un outil marketing.
它的设计目标很明确:让你感觉自己在高产。Boris,Claude Code 的项目负责人,在做这个产品时最初的思考是: “如果模型变得足够聪明,代码会变成什么样?我希望如何使用这些东西?”——出发点不是“如何帮开发者省 token”,而是“如何展示模型的聪明”。
Son objectif de conception est clair : vous faire sentir que vous êtes productif. Boris, le chef de projet de Claude Code, a réfléchi au départ à ce produit : « Si le modèle devient suffisamment intelligent, à quoi ressemblerait le code ? Comment voudrais-je utiliser ces choses ? » — Le point de départ n’est pas « comment aider les développeurs à économiser des tokens », mais « comment montrer l’intelligence du modèle ».
Anthropic 愿意为这种“感觉”烧掉大量 token——不管是你的钱,还是它们自己的钱。五分钟花掉 200 美元,对 Claude Code 来说不是事故,是设计。它的底层逻辑是:能多烧 token 解决的问题,绝不找更省 token 的办法。 所有 sub-agent、所有花哨的 UI 动画、所有冗长的 reasoning trace,都不是为了效率,而是为了让你盯着屏幕时,觉得“这模型真聪明,真能干”。
Anthropic est prêt à brûler énormément de tokens pour cette « sensation » — que ce soit votre argent ou le leur. Dépenser 200 dollars en cinq minutes n’est pas un accident pour Claude Code, c’est une conception. Sa logique sous-jacente est : pour tout problème pouvant être résolu en brûlant plus de tokens, ne cherche jamais de méthode plus économique. Tous les sous-agents, toutes les animations UI tape-à-l’œil, toutes les longues traces de raisonnement ne sont pas pour l’efficacité, mais pour que, en regardant l’écran, vous pensiez « ce modèle est vraiment intelligent, vraiment compétent ».
这背后是一个精心设计的营销闭环:你烧掉大量 token,换来“高产”的感觉,于是觉得 Claude 好用,然后继续用它。 Anthropic 甚至愿意自己承担大量 token 成本,来换取这种情绪上的认同。这也是为什么它们的桌面应用明显投入不足——Claude Code 的目标从来不是做一个好工具,而是成为 Anthropic 模型能力的"最佳展示窗口"。
Derrière cela se trouve une boucle marketing soigneusement conçue : vous brûlez beaucoup de tokens, vous obtenez une sensation de « productivité », donc vous trouvez Claude utile, et vous continuez à l’utiliser. Anthropic est même prêt à supporter lui-même d’importants coûts de tokens pour obtenir cette approbation émotionnelle. C’est aussi pourquoi leur application de bureau est manifestement sous-investie — l’objectif de Claude Code n’a jamais été d’être un bon outil, mais de devenir la « meilleure vitrine » des capacités des modèles d’Anthropic.
而恰恰是这种"烧 token 换体验"的设计哲学,让 Claude 在 token 效率上被 OpenAI 甩开了。
Et c’est précisément cette philosophie de conception « brûler des tokens pour l’expérience » qui fait que Claude est distancé par OpenAI en termes d’efficacité des tokens.
OpenAI 一直在拼命压 token。从 reasoning trace 的压缩,到模型本身的效率优化,它们的哲学是:用更少的 token,干同样的活。Codex 5.5 就是最好的例子。
OpenAI n’a cessé de comprimer les tokens. De la compression des traces de raisonnement à l’optimisation de l’efficacité des modèles, leur philosophie est : faire le même travail avec moins de tokens. Codex 5.5 en est le meilleur exemple.
尽管像 Fable 5 这样的模型很智能,但与其他模型相比,它的效率不算高,Deep SWE 的这张图很能说明问题。如果将同批模型放一起对比,则更明显:GPT-5.5 medium 只用了 2 万个 token,就拿到了惊人的分数;而 Opus 4.8 用了 5 万个 token,得分反而更低。
Bien que des modèles comme Fable 5 soient intelligents, leur efficacité n’est pas élevée par rapport à d’autres modèles ; ce graphique de Deep SWE est très parlant. Si l’on compare les modèles de la même série, c’est encore plus évident : GPT-5.5 medium n’a utilisé que 20 000 tokens pour obtenir un score impressionnant, tandis qu’Opus 4.8 a utilisé 50 000 tokens pour un score inférieur.
这就是两条路线最直接的写照:行业在恐慌,Claude 在烧,OpenAI 在省。而接下来的问题就是——既然要降本,第一个该砍的是什么?答案是:那些堆了太久的提示词。
C’est l’illustration la plus directe des deux voies : l’industrie panique, Claude brûle, OpenAI économise. Et la question suivante est : puisque nous devons réduire les coûts, que faut-il couper en premier ? Réponse : les prompts accumulés depuis trop longtemps.
Claude Code 的 Prompt 债:堆得越多,欠得越多
La dette de prompts de Claude Code : plus on empile, plus on doit
在最新的演讲中,Anthropic 表示,他们已经删掉了 Claude Code 80% 的系统提示词。
Dans une récente présentation, Anthropic a déclaré avoir supprimé 80 % des prompts système de Claude Code.
Anthropic 技术团队成员 Tariq Shihipar 解释说,这反映出 AI 模型引导方式正在发生一次根本变化——过去,人们认为指令越多、例子越多,模型表现就越好;但现在,这个逻辑不再成立。新模型 Fable 5 比它们自己给的示例更有想象力,示例反而成了限制。
Tariq Shihipar, membre de l’équipe technique d’Anthropic, explique que cela reflète un changement fondamental dans la manière de guider les modèles d’IA — auparavant, on pensait que plus il y avait d’instructions et d’exemples, meilleure était la performance du modèle ; mais aujourd’hui, cette logique ne tient plus. Le nouveau modèle Fable 5 est plus imaginatif que les exemples qu’ils lui donnent, et ces exemples deviennent une limitation.
这当然有营销成分,他吹嘘了一把 Fable 的能力:“示例反而容易限制模型,因为它实际上比我们给出的示例更有想象力”。但一个事实绕不过去:连 Anthropic 自己都开始对 system prompt 下刀了。
Il y a bien sûr une part de marketing, il a vanté les capacités de Fable : « Les exemples limitent facilement le modèle, car il est en réalité plus imaginatif que les exemples que nous donnons ». Mais un fait demeure : même Anthropic commence à tailler dans les prompts système.
那么,为什么以前需要那么多 prompt?
Alors, pourquoi tant de prompts étaient-ils nécessaires auparavant ?
过去一两年,AI Coding 圈形成了一套惯性思维:上下文越大越好,工具说明越多越好,system prompt 越完整越好。模型不知道项目怎么组织?写 Agents.md。模型不知道工具怎么用?写 tool descriptions。模型不够主动?写行为引导。模型不够稳定?继续往 system prompt 里加约束。
Au cours des un ou deux dernières années, un mode de pensée par défaut s’est formé dans le cercle du codage IA : plus le contexte est grand, mieux c’est ; plus les descriptions d’outils sont nombreuses, mieux c’est ; plus le prompt système est complet, mieux c’est. Le modèle ne sait pas comment organiser le projet ? Écrivez Agents.md. Le modèle ne sait pas comment utiliser les outils ? Écrivez des descriptions d’outils. Le modèle n’est pas assez proactif ? Ajoutez des guides de comportement. Le modèle n’est pas assez stable ? Continuez à ajouter des contraintes dans le prompt système.
不可否认,system prompt 曾经是 AI Coding 工具的核心竞争力。对 LLM 的 prompt 做一些小调整,就可能带来显著的性能提升。如果同一个模型在 Codex、Cursor、OpenCode 和 Copilot 里的感觉不一样,那几乎肯定是因为 prompting 上存在细微差异。
Il est indéniable que le prompt système a été autrefois le cœur de la compétitivité des outils de codage IA. De petits ajustements dans les prompts d’un LLM peuvent apporter des améliorations significatives des performances. Si le même modèle semble différent dans Codex, Cursor, OpenCode et Copilot, c’est presque certainement dû à des différences subtiles dans le prompting.
这也是为什么 Cursor 曾花大量时间测试 system prompt,做 A/B testing,针对不同模型微调提示方式。与在 Claude Code 里使用 Opus 相比,Cursor 的 harness 能显著提升模型表现,一些 benchmark 测到的提升甚至高达 10% 到 30%。 差别核心往往就是那几段 prompt。
C’est aussi pourquoi Cursor a passé beaucoup de temps à tester les prompts système, à faire des tests A/B, et à affiner les méthodes de prompting pour différents modèles. Comparé à l’utilisation d’Opus dans Claude Code, le harnais de Cursor améliore considérablement les performances du modèle, certaines mesures de benchmark montrant même une amélioration de 10 à 30 %. La différence clé réside souvent dans ces quelques prompts.
但问题是只要 prompt 有用,团队就会不断往里加东西。某个模型喜欢乱用工具,就加一段规则;某个模型不够主动,就加一段鼓励;某个模型搜索太多,就补一段限制;某个模型不理解项目上下文,就再加一个 markdown 文件。每一次增加都有理由,但长期堆下来,system prompt 开始变成一个巨大的常驻上下文包袱。
Mais le problème est que tant qu’un prompt est utile, l’équipe continue d’en ajouter. Un modèle aime utiliser les outils à tort et à travers ? Ajoutez une règle. Un modèle n’est pas assez proactif ? Ajoutez un encouragement. Un modèle cherche trop ? Ajoutez une restriction. Un modèle ne comprend pas le contexte du projet ? Ajoutez un fichier markdown. Chaque ajout a sa raison, mais à long terme, le prompt système devient un énorme fardeau de contexte permanent.
问题在于:system prompt 不是免费的。 它每次调用都要被读入、计费、占上下文。
Le problème est que le prompt système n’est pas gratuit. Il est lu, facturé et occupe du contexte à chaque appel.
Claude Code 把所有工具和功能内置进去之后,system prompt 一度膨胀到 65,000 个 token;即便关闭大部分功能,也还有 12,000 个 token。 换句话说,模型还没开始写一行代码,就已经背上了一本说明书。对比来看,Pi 启动时上下文不到一千个 token。
Après avoir intégré tous les outils et fonctionnalités dans Claude Code, le prompt système a gonflé jusqu’à 65 000 tokens ; même en désactivant la plupart des fonctionnalités, il reste 12 000 tokens. Autrement dit, avant même que le modèle n’ait écrit une ligne de code, il porte déjà un manuel d’instructions. En comparaison, Pi a moins d’un millier de tokens de contexte au démarrage.
更麻烦的是,prompt 债比代码债更隐蔽。
Plus embêtant encore, la dette de prompts est plus insidieuse que la dette de code.
代码老了,通常会在改功能、跑测试、处理 bug 时暴露出来。Prompt 老了,却可能只是让模型悄悄变差。用户看到的是“Claude Code 最近好像不如以前聪明了”,或者“新模型没有宣传得那么强”,但真实原因可能是旧的 system prompt 没有跟上新模型。
Quand le code vieillit, il se révèle généralement lors des modifications de fonctionnalités, des tests ou des corrections de bugs. Quand un prompt vieillit, il peut simplement rendre le modèle plus mauvais en douce. L’utilisateur voit « Claude Code semble moins intelligent qu’avant » ou « le nouveau modèle n’est pas aussi puissant qu’annoncé », mais la vraie raison pourrait être que l’ancien prompt système n’a pas suivi le nouveau modèle.
当 prompt 从竞争力变成负担时,Anthropic 选择删掉 80%,也能进一步提升 token 效率。
Quand le prompt passe d’un avantage compétitif à un fardeau, Anthropic choisit d’en supprimer 80 %, ce qui peut également améliorer l’efficacité des tokens.
Claude 的“废话税”:多说一个字,多花一份钱
La « taxe de bavardage » de Claude : un mot de plus, un coût supplémentaire
Claude Code 的废话实在太多了。
Claude Code a vraiment trop de bavardage.
今年有一个叫 Caveman 的插件迅速走红,专门解决这个问题。它的名字直译是"穴居人",意思是像原始人一样说话——不讲礼貌,不加多余语法,不放填充词,只保留核心意思。
Cette année, un plugin appelé Caveman est rapidement devenu viral, spécialement pour résoudre ce problème. Son nom se traduit littéralement par « homme des cavernes », signifiant parler comme un homme primitif — pas de politesse, pas de grammaire superflue, pas de mots de remplissage, seulement le sens essentiel.
乍一看,它听起来像个玩笑。但一旦理解,你会发现它解决的是 LLM 里一个非常真实的问题:废话太多、token 太多、成本也不必要地变高。
À première vue, cela ressemble à une blague. Mais une fois compris, vous réalisez qu’il résout un problème très réel dans les LLM : trop de bavardage, trop de tokens, et des coûts inutilement élevés.
而它的起源,正是针对 Claude Code。
Et son origine cible précisément Claude Code.
“我是在 4 月初做出 Caveman 的,因为那段时间我重度使用 Claude Code,并且注意到我的很多 token 花费都浪费在了不必要的文字上:寒暄、模糊措辞、过渡语,以及那些在 agent loop 里其实并不重要的闲聊式表达。”Caveman 的创建者 Julius Brussee 说。
« J’ai créé Caveman début avril, car à cette époque j’utilisais intensément Claude Code et j’ai remarqué que beaucoup de mes dépenses en tokens étaient gaspillées en texte inutile : politesses, formulations vagues, transitions, et ces expressions de type conversation qui ne sont pas vraiment importantes dans une boucle d’agent », explique Julius Brussee, le créateur de Caveman.
Brussee 的评测显示,Caveman 相比默认输出能减少 65% 到 75% 的输出 token,效果仍然超过普通的"请简洁"指令。 它主要压缩的是周围的语言,不影响代码、命令、路径、URL、函数名这些需要精确性的部分。
Les tests de Brussee montrent que Caveman réduit de 65 à 75 % les tokens de sortie par rapport à la sortie par défaut, surpassant encore l’instruction courante « soyez concis ». Il comprime principalement le langage environnant, sans affecter les parties nécessitant de la précision comme le code, les commandes, les chemins, les URL, les noms de fonctions.
据报道,OpenAI 的工程总监 Shayne Sweeney 也为该项目贡献了代码,以支持 Codex。
Selon des rapports, Shayne Sweeney, directeur de l’ingénierie chez OpenAI, a également contribué au projet avec du code pour prendre en charge Codex.
更有意思的是,OpenAI 早就把这种语言模式应用到了思考环节。
Plus intéressant encore, OpenAI a depuis longtemps appliqué ce mode de langage aux phases de réflexion.
一些泄露出来的 reasoning trace (不是对外显示的reasoning summary )让外界看到了端倪。内容不像普通英语,更像压缩过的工程速记:
Quelques traces de raisonnement divulguées (pas les résumés de raisonnement affichés publiquement) ont révélé des indices. Le contenu ne ressemble pas à de l’anglais ordinaire, mais plutôt à un sténographique d’ingénierie compressé :
这些句子看起来很好笑,甚至有点乱,但它们的重点不在可读性,而在 token 效率。模型在内部推理时,不需要像对用户说话那样保持礼貌、完整和流畅。它只需要保留动作、对象、判断和下一步。换句话说,只要最终答案是正常的,模型内部完全可以用一种更短、更粗糙、更省 token 的语言完成思考,以疯狂追求 token 效率。
Ces phrases semblent drôles, voire un peu désordonnées, mais leur priorité n’est pas la lisibilité, c’est l’efficacité des tokens. Lorsqu’un modèle raisonne en interne, il n’a pas besoin d’être poli, complet et fluide comme lorsqu’il s’adresse à un utilisateur. Il doit seulement conserver les actions, les objets, les jugements et l’étape suivante. En d’autres termes, tant que la réponse finale est normale, le modèle peut tout à fait utiliser un langage plus court, plus grossier et plus économique en tokens pour penser, en quête effrénée d’efficacité des tokens.
这甚至比在写 Prompt 环节更有用。压缩 reasoning token 的收益更大,因为 agent 是多步执行的,前一步的思考会变成后一步的输入。模型每少“想”一段,省下来的就不只是当下这几个 token,而是后面整条执行链上的重复开销。
C’est même plus utile que dans la phase d’écriture des prompts. Les gains de la compression des tokens de raisonnement sont plus importants, car l’agent exécute plusieurs étapes, et la réflexion de l’étape précédente devient l’entrée de l’étape suivante. Chaque fois que le modèle « pense » un peu moins, les économies ne portent pas seulement sur ces quelques tokens immédiats, mais sur les frais récurrents de toute la chaîne d’exécution suivante.
这正是 OpenAI 和 Claude 路线上的一个明显差异。
C’est précisément une différence évidente entre les voies d’OpenAI et de Claude.
Claude 一直更好聊,也更像一个用完整语言思考和表达的助手。只要看看它的 reasoning trace 长很多,就能猜到它可能是在用普通英语。它的输出和 reasoning 往往更长,所以更依赖大上下文窗口来容纳这些内容。
Claude a toujours été plus agréable à parler, et ressemble davantage à un assistant qui pense et s’exprime dans un langage complet. Rien qu’en voyant ses traces de raisonnement beaucoup plus longues, on devine qu’il utilise probablement un anglais ordinaire. Ses sorties et ses raisonnements sont souvent plus longs, donc il dépend davantage de grandes fenêtres de contexte pour contenir ces éléments.
这也是为什么 Claude 默认使用 100 万 token 的上下文窗口。很多人以为这是因为它想装进更大的代码库,但原因其实更简单:Claude 生成的东西太长了,没有这么大的窗口装不下。 它们甚至在 compaction 上也很差,当你恢复旧线程时,Claude 会建议你不要保留完整上下文,而是尝试 compact。因为它们不会保留 reasoning trace——事实上,它们会在 10 到 20 分钟后清掉这些东西,因为 reasoning token 效率太低,不值得一直保留,否则成本会荒谬到不可接受。
C’est aussi pourquoi Claude utilise par défaut une fenêtre de contexte d’un million de tokens. Beaucoup pensent que c’est parce qu’il veut contenir une base de code plus grande, mais la raison est en fait plus simple : ce que Claude génère est trop long, et sans une si grande fenêtre, cela ne tiendrait pas. Ils sont même mauvais en compaction : lorsque vous restaurez un ancien thread, Claude suggère de ne pas conserver le contexte complet, mais d’essayer de le compacter. Car ils ne conservent pas les traces de raisonnement — en fait, ils les effacent après 10 à 20 minutes, car les tokens de raisonnement sont trop inefficaces pour être conservés, sinon le coût deviendrait ridiculement inacceptable.
而 OpenAI 模型的 token 上下文窗口大概是 20 万或更少,但因为它们一开始就通过这种简短语言做到了压缩。
Quant aux modèles d’OpenAI, leur fenêtre de contexte de tokens est d’environ 200 000 ou moins, mais parce qu’ils ont dès le départ réalisé la compression via ce langage succinct.
一个值得品味的细节:如果 Anthropic 修复了“废话太多”这个问题,它们的收入会明显下降。如果开发者可以用模型完成同样的工作,但生成的 token 更少,那就是它们赚不到的钱。
Un détail à savourer : si Anthropic résolvait le problème du « trop de bavardage », leurs revenus chuteraient significativement. Si les développeurs pouvaient accomplir le même travail avec le modèle, mais avec moins de tokens générés, ce serait de l’argent qu’ils ne gagneraient pas.
来源:InfoQ
Source : InfoQ
风险提示及免责条款
Avis de risque et clause de non-responsabilité
Les marchés comportent des risques, investissez avec prudence. Cet article ne constitue pas un conseil d’investissement personnel et ne tient pas compte des objectifs d’investissement, de la situation financière ou des besoins spécifiques de chaque utilisateur. Les utilisateurs doivent déterminer si les opinions, points de vue ou conclusions contenus dans cet article correspondent à leur situation particulière. Investir sur cette base engage votre propre responsabilité.