Futures
Accédez à des centaines de contrats perpétuels
TradFi
Or
Une plateforme pour les actifs mondiaux
Options
Hot
Tradez des options classiques de style européen
Compte unifié
Maximiser l'efficacité de votre capital
Trading démo
Introduction au trading futures
Préparez-vous à trader des contrats futurs
Événements futures
Participez aux événements et gagnez
Demo Trading
Utiliser des fonds virtuels pour faire l'expérience du trading sans risque
Lancer
CandyDrop
Collecte des candies pour obtenir des airdrops
Launchpool
Staking rapide, Gagnez de potentiels nouveaux jetons
HODLer Airdrop
Conservez des GT et recevez d'énormes airdrops gratuitement
Launchpad
Soyez les premiers à participer au prochain grand projet de jetons
Points Alpha
Tradez on-chain et gagnez des airdrops
Points Futures
Gagnez des points Futures et réclamez vos récompenses d’airdrop.
Investissement
Simple Earn
Gagner des intérêts avec des jetons inutilisés
Investissement automatique
Auto-invest régulier
Double investissement
Profitez de la volatilité du marché
Staking souple
Gagnez des récompenses grâce au staking flexible
Prêt Crypto
0 Fees
Mettre en gage un crypto pour en emprunter une autre
Centre de prêts
Centre de prêts intégré
Lin Junyang s'exprime pour la première fois après son départ ! Retour sur les erreurs de Qianwen, et indication de la nouvelle voie de l'IA
林俊旸,离职阿里千问后首次发声。
他没有回应离职风波或宣告去向,而是发长文探讨从“推理模型时代的思考”到“智能体时代的思考”的转变。
整篇文章谈的是技术和AI的未来方向,但字里行间对千问技术路线的反思藏不住。
他在文中坦白承认“我们没有全做对”(We did not get everything right),
千问团队曾有一个雄心勃勃的构想:把thinking和instruct两种模式合并到一个模型里。
Qwen3就是这个方向上“最清晰的公开尝试之一”,它引入了混合思维模式。
但在今天的林俊旸仍不够满意,他觉得最终thinking变得啰嗦且犹豫不决,instruct变得不够干脆、不够可靠,还更贵了。
在他看来,真正成功的合并,不是把两种人格硬塞进一个checkpoint,而是让模型拥有一个连续的推理努力光谱。
面对未来,他还给出这样的判断:过去两年Reasoning Thinking时代的使命已经完成了。
OpenAI的o1和DeepSeek-R1证明了推理能力可以被训练和复现,这教会了整个行业一个关键认知:
2025年上半年开始,大家几乎都在研究同一件事:怎么让模型花更多推理时间、怎么训练更强的奖励、怎么控制推理的力度。
现在最关键的问题是,下一步是什么?
林俊旸的答案是Agentic Thinking,智能体式思维,在与环境的交互中不断修正计划。
他列出了Agentic Thinking和Reasoning Thinking的关键区别:
判断何时停止思考、开始行动。推理模型输出完答案就结束了,智能体要在思考和行动之间不断切换。
选择调用哪个工具、以什么顺序。不是简单的function call,是动态规划问题。
消化来自环境的噪声和部分观测。真实世界不会给你完美反馈。
失败后修正计划,而不是推倒重来。
跨越多轮对话和多次工具调用保持连贯。
他用一句话做出总结:
在林俊旸看来,未来的竞争力不只来自更好的模型,还来自更好的环境设计、更强的harness工程、以及多个智能体之间的编排。
从训练模型,到训练智能体,再到训练系统。
(以下为林俊旸原文翻译。)
本文来源:量子位
风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。