好吧,2024年1月在AI界简直疯狂。在其他人还在从假期中恢复过来时,硅谷完全没有休息。OpenAI推出了ChatGPT的医疗版,Anthropic也决定开始“治人”,而谷歌则发布了一整套更新。同时,大家都开始变现自己的产品——ChatGPT广告收入达到$60 CPM,ChatGPT Go订阅每月$8 美元,Google AI Plus售价$7.99。这看起来像是在争夺用户的钱包。



最疯狂的事情是马斯克与OpenAI之间的法律大战。现在他要求$134 亿美元的非法利润,理由是早期投入了$38 百万美元。从邮件中透露,伊利亚·苏茨克维尔在公司中的持股约为$4 亿美元(根据2023年的估值()。如果按当前估值)亿美元推算,他的财富可能超过$850 亿美元。庭审定于4月举行。

接下来谈产品。Claude Code正式集成到VS Code中,并获得了终端访问权限——实现了在一个窗口内完整的开发流程。此外,还有Chrome浏览器扩展Claude in Chrome,可以点击、填表、自动化UI测试。Cowork for macOS允许代理直接操作文件,虽然有点吓人——模型可能会删除文件,如果它认为这是任务的一部分。

谷歌推出了TranslateGemma——支持55种语言的开源翻译模型。4B参数的小版本表现相当于12B基础版Gemma。还推出了Personal Intelligence——将Gemini深度集成到Gmail和Google Photos中,可以在不同服务中找到你的信息。听起来很强大,但也引发了隐私问题。

中国团队也不落后。阿里巴巴发布了Qwen3-Max-Thinking,在基准测试中与GPT-5.2竞争。DeepSeek-OCR 2能像人一样阅读文档,而不是像扫描仪那样。Moonshot AI推出了Kimi K2.5,支持“罗伊”代理模式——可以同时启动多达100个专业子代理。

在安全方面,英伟达陷入麻烦——员工联系了“Anna's Archive”$100 盗版图书馆(的管理员,并下载了约500TB的受保护内容。管理层在一周后批准了此事,理由是受到竞争压力。维基媒体基金会终于开始变现内容——科技巨头将为使用维基百科训练模型的商业API付费。

在Anthropic内部,管理变得更严格了。封锁了xAI工程师通过Cursor访问Claude Opus 4.5,禁止在OpenCode等第三方客户端使用个人订阅。官方说这是为了改善用户体验,实际上是为了保护单位经济。

一些有趣的案例:Claude帮助用Arduino控制番茄的生长,通过调节光照和浇水。JPL NASA用Claude规划了“毅力号”火星车的路线——模型在400米的岩石地带绘制了路径。Axiom Prover在Patnema数学竞赛中解决了全部12个题目,并用Lean语言生成了证明。

Meta以)亿美元收购了Manus。这家创业公司展示了自动化的实际案例,年收入已达$2 百万美元。但交易可能会很复杂——创始人起初在北京创业,引起了两边监管机构的关注。

在Murray Murati的创业公司“Thinking Machines Lab”发生了“肥皂剧”。CTO巴雷特·佐夫和同事卢克·梅茨在与冲突后返回了OpenAI。佐夫隐瞒了与一名员工的关系,后来被解雇,自己也被降职,之后又要求对技术方案拥有全部控制权。Murati得知他与Sam Altman的谈判后,解雇了他。创业公司失去了半数创始人。

关于工具方面:Cursor通过“动态上下文发现”优化了代理的工作,减少了47%的令牌消耗。Amarsia管理AI功能的基础设施,无需编写后端。Nativeline能生成纯粹的Swift代码,用于iOS开发。还有一款用于一键生成一次性密码和双因素认证的应用,能与代理集成,实现安全自动化。

研究显示在推理、计算扩展和内存处理方面取得了进展。DeepSeek通过对多重随机矩阵的映射,稳定了多线程连接。英伟达在测试期间提出了“训练中学习”——模型在读取上下文时实时更新权重。KVzap几乎免费地将KV缓存压缩了3到4倍。

总体来看,1月证明了AI行业没有减速——反而在加速。变现、竞争、法律纷争、实际应用案例层出不穷。代理已经能管理文件、编写代码、规划火星路线,甚至还能种植植物。唯一的问题是,这一切何时才能成为常态,而不再是新闻。
查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论