硅基流动流血冲刺 IPO,Token 工厂是否是一门好生意?

撰文:小饼

2023年底的一天,清华科技园楼下的喜家德饺子馆里,袁进辉刚坐下,就听到邻桌在议论他的公司:“OneFlow技术做得挺好,最后还不是没挣到钱,被收购了。”

他后来向《晚点LatePost》回忆这一幕时说,自己有时会想,是不是做了一个不好的范例:技术判断没问题,也勤勤恳恳做事,还是没能取得大家认可的成功。

两年半后,2026年6月30日,他带着一份347页的招股书站到了港交所门口。这一次,他想证明那个在饺子馆里被质疑的命题:好的技术能赚钱。

然而,招股书先给出了一个残酷的中期成绩:2025年,这家公司每进账1块钱,光直接成本就要花出去1块2。

这是一家怎样的公司?

硅基流动不做大模型,也不造芯片,它做的事,一句话就能说清:从上游租来算力,加工成Token,再卖给下游。

硅基流动的角色,类似一座炼油厂。

炼油厂自己没有油田,它买进原油,加工成汽油卖出去,赚的是中间的差价。硅基流动同样没有油田,它向云厂商租来英伟达GPU,也租来昇腾、沐曦、摩尔线程这些国产芯片,用自己研发的推理引擎把这些五花八门的算力加工成标准的Token,按量卖给开发者和企业。租金是它的进货价,Token是它的零售价,中间的差价就是它的利润空间。

问题是,这个差价现在是负的。

2024年,公司规模还小的时候,这门生意是赚钱的,进销差价能留下39.4%的毛利。

到了2025年,收入暴增653.2%、冲到5533万元,毛利率却掉到了负24%。其中卖得最火的公有云Token业务,毛利率是负119%,相当于每卖100块钱的Token,先倒贴119块。

为什么会这样?

一头是进货贵:为了接住随时可能涌来的海量用户,公司必须提前租下大批算力囤着,2025年的销售成本从前一年的445.2万元飙到6863.2万元,超过了全年总收入,而囤下的算力还没被充分用起来。

另一头是零售价被人往死里砸:大厂为了抢开发者,屡次降价,部分主流模型每千Token的价格砍掉了九成以上;今年5月,DeepSeek宣布V4-Pro永久降价75%,腾讯云跟着降,最狠的降了97.5%。

更麻烦的是,进货价和零售价,两头都轮不到硅基流动说话。算力的租金,上游云厂商定;Token的售价,大厂的价格战定。阿里和字节降价,是拿别的业务赚的钱来补贴、抢地盘;硅基流动这样只靠差价吃饭的独立玩家,每看到一张降价公告,都等于眼睁睁看着自己的利润被削掉一层。

泼天的流量,泼天的账单

这家公司最风光的时刻,恰恰把上面这套逻辑照得最亮。

2025年2月1日,DeepSeek火遍全球,官方服务器被挤爆,千万用户想用而用不上。

硅基流动抓住了这个窗口,联合华为云,基于昇腾芯片第一家上线了满血版R1和V3的服务,一举接住了溢出的人潮。再配上“注册送14元、邀请再送14元”的拉新玩法,网站访问量飙升近40倍。注册用户从2024年底的12.7万,涨到今年4月底的1028万;平台每天处理的Token达到5785亿个,最高一天突破1.07万亿个。按2025年的吞吐量算,它已经是中国最大的独立Token供应平台。

账单写在另外几页:2025年净亏损3.45亿元,是前一年的4.2倍;就算剔除股权激励这类账面因素,经调整后仍亏1.87亿元,经营活动一年流出现金1.72亿元,平均每个月烧掉约1480万。从2023年8月成立算起,三年累计亏了约4.4亿元。

对一座正常的工厂来说,订单暴涨是天大的好事。对一座差价为负的工厂来说,订单暴涨只意味着一件事:亏钱的速度也在暴涨。

凭什么值77.4亿?

看到这里,你可能会问:这么一门亏钱生意,凭什么三年融资七轮,估值从天使轮的2.8亿元一路涨到77.4亿元?凭什么阿里、美团、华为哈勃、商汤、智谱、创新工场全挤在股东名单里?

在算力局看来,它手里还捏着两张真正的牌。

第一张牌,叫中立。开发者最怕的事情之一,是把整个业务绑死在某一家大厂的云上,将来想搬家,成本高到搬不动。一个不属于任何巨头的Token平台,天然让人放心。巨头们的钱同时出现在它的股东名单里,恰恰说明各方都需要这么一个谁也不控股的中间地带。

第二张牌,才是真正的王牌叙事:国产算力的变电站。

英伟达的芯片供给受限,是摆在整个中国AI行业面前的现实。昇腾、沐曦、摩尔线程这些国产芯片顶了上来,但它们各有各的架构、各有各的脾气,开发者直接上手,门槛极高。

硅基流动做的事,是把这些性格迥异的国产芯片统一翻译成人人都会用的标准Token。DeepSeek满血版能在昇腾芯片上顺畅跑起来,背后就是这层翻译能力。

这件事,大厂未必愿意替竞争对手的芯片做,芯片厂自己又做不精,但整个国产算力生态离不开。它像电网里的变电站:上游的发电厂可以换,下游的用电户可以换,变电站的位置反而是最稳的。

今年6月,公司把老东家OneFlow的全部知识产权买了回来,补强的正是这一层。这也是它敢用港股18C章(专为未盈利科技公司开的通道)冲刺上市的底气:招股书援引弗若斯特沙利文的预测,中国Token供应市场2024年到2025年规模涨了16倍,未来五年还将以每年638.3%的速度膨胀。

Token工厂是不是一门好生意?招股书给出的答案是分裂的:靠差价卖标准Token,眼下是一门苦生意;做国产算力的变电站,可能是一门时代级的生意。硅基流动的赌注在于,能不能靠前者的流量活着,等到后者的收成。

屡败屡战

要理解这家公司为什么敢下这样的赌注,得回到袁进辉这个人。

他这一路,几乎每一步都踩在“差一点”上。 西安电子科技大学本科,2003年以计算机系头名直博清华,师从张钹院士,读博加博士后,在清华园待了近十年。他原本的人生剧本是留校任教,却因为选了计算神经科学这条冷门的交叉赛道,没能等来教职。离讲台只差临门一脚,最终没有站上去。

离开象牙塔时,中国互联网最肥美的黄金年代已经与他擦肩而过。他辗转有道、360,后来在微软亚洲研究院做出了被快手等公司采用的核心系统,拿下院长特别奖。

2017年,他带着一个当时几乎没人信的判断出来创业:未来的模型会大到旧框架装不下,底层系统必须重写。这就是OneFlow。后来的大模型浪潮证明他赌对了方向,公司却没能等到收获季,2023年以1亿美元估值卖给了王慧文的光年之外,几个月后,光年之外又整体并入美团。

判断对了,活下来了,依然没能赢,这才是饺子馆里那句“评论”真正扎心的地方。

彼时的袁进辉手里握着大厂的高薪邀约,团队里的人也各自有体面的去处。他的选择是带着40人队伍里的35个,第三次出发。他对外解释过原因:在业务庞大的大公司里,AI框架的优先级不见得很高;而对这支队伍来说,这就是唯一。新公司取名硅基流动,“硅基”指芯片,“流动”指让算力流动起来的软件,与OneFlow遥相呼应,像是给上一段没写完的故事续了一笔,宣布再创业的朋友圈里,他写的是:“过去15年不算顺利,屡败屡战。”

中国科技行业从来不缺会讲故事的人,稀缺的反而是这种判断对了方向、输掉了结局、还愿意回到牌桌的人。硅基流动的招股书算不上漂亮,但它背后站着一个用二十年反复验证同一个信念的工程师:好的技术,应该配得上商业上的成功。

无论最终IPO市场报价如何,都祝硅基流动好运,也祝袁进辉这一次把故事写完,屡败屡战,终有春天。

此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论