OpenAI狂吃应用层?a16z:机会在「黄砖路」之外,创业者机会还在后面

a16z合夥人指出,AI应用層並非單一戰场,創业公司应避开大模型公司直攻的橫向工具,转向垂直产业深耕。本文源自推特貼文。
(前情提要:Google 领投 AI 路由平台 OpenRouter,估值 13 亿美元一年成长 240%)
(背景補充:Sam Altman 对談 a16z 創辦人:OpenAI 將激进押注基礎设施,Sora 是重要戰略工具)

本文目錄

Toggle

  • 焦慮蔓延:大模型吞噬应用層?
  • 黄磚路陷阱:橫向工具必死之路
  • 奧茲国机会:垂直工作流護城河
  • 成本優勢:模型路由与后訓練
  • 控制平面:合規与治理价值

这正是 a16z 合夥人 Joe Schmidt 在这篇文章中試圖回答的问題。他借用《綠野仙蹤》中的「黄磚路」作比喻,將 AI 应用机会分成两類:一類是大模型公司正在親自进入的主路,比如程式碼生成、寫作、影像生成、通用型 Agent 和橫向辦公助手;另一類則是「奧茲国的其他地方」,也就是那些深入产业流程、依賴複雜工作流、资料沉澱、合規治理和系统整合能力的垂直场景。

在他看来,創业公司真正的机会在后者。

从销售到保险,Joe Schmidt 反覆強调同一个逻辑:企业真正願意付费的,不是一个更聰明的聊天視窗,而是一个能对业務結果负责的系统。它需要理解客戶资料的混亂狀態,處理多人審批和边界案例,承擔合規与審计责任,也要在模型不斷升級时,替客戶完成迁移、路由和成本最佳化。

这也是本文对下一代企业软體的核心判斷:底層模型会越来越強,也会變得越来越可替換;但真正不可替代的,是圍繞具體产业和具體工作流沉澱下来的资料、流程、治理能力与營运記憶。AI 应用公司的机会,不在於与模型公司爭奪「黄磚路」,而在於走进那些更復雜、更髒、更慢,但也更接近真实商业价值的地方。

最近,我不斷从創始人和潛在員工那裡聽到同一个问題:AI 应用層还有什麼可做的嗎?还是说,OpenAI 和 Anthropic 最終会殺死一切?

这个问題背后有一種很典型的 AI 式焦慮。有人已经得出結論:如果不想淪为永久性的底層,唯一有长期价值的位置,要麼是在大模型实验室內部,要麼是在机器人、硬科技或類似前沿领域創业——理論上,也就是去做那些「实验室碰不到」的东西。因为如果每一類软體都將被吞噬,要麼被 Codex 或 Claude 直接吸收掉对应工作,要麼被未来某个模型變得不再必要,那最好的选擇似乎就是:快跑!

我承认,自己幾乎也是一个 AI 極大主義者,而且我认为他們说对了一半。大模型实验室確实正在进入应用層的大片区域。但「应用層」並不是一个同质化的机会集合。真正关鍵的判斷標準是:你是在走「黄磚路」,还是在奧茲国的其他地方。

注:「黄磚路」 是《綠野仙蹤》裡通往奧茲国翡翠城核心地帶、去见「魔法師」的主路。

所謂「黄磚路」,是我們用来形容大模型实验室正在走、並投入巨大资源的那條路徑。程式碼生成、寫作、影像創作这類问題之所以天然适合实验室来做,是因为它們会随著模型原始能力的提升而變得更好:每一美元投入到预訓練和后訓練中,都会直接改善产品质量。

但奧茲国的其他地方,存在著更復雜、通常也更垂直的问題。它們並不是簡單地給一个企业使用者提供一个橫向工具,让它接入標準工具和电腦操作能力就能解決。这裡的价值,更多来自模型周圍的腳手架:这些腳手架让输出在特定产业中變得可信、合規,並能真正进入业務流程。底層模型的原始能力当然仍然关鍵,但已经不是全部。

我們正在即时看到这一点。OpenAI 和 Anthropic 实际上正在向市场承认:它們无法用一个通用的 AI 同事解決所有问題。它們已经宣布投入大規模的前線部署式合资專案,圍繞为企业配置和定製模型来搭建完整公司。如果它們真的认为下一次模型发布就能解決这些问題,就不会向这類專案投入數十亿美元。

焦慮蔓延:大模型吞噬应用層?

所以,如果你想靠做 AI 应用賺钱,就不要走黄磚路,而要去奧茲国的其他地方建设。以下是我們以及我們投资組閤中的一些創始人,在实踐中学到的经验。

如果你要創辦一家公司,黄磚路是最顯眼的一條路,但也是最危险的一條路。拿一个高效能模型,接上一些现成的聯結器,比如 Google Drive、Slack、Salesforce、Notion、GitHub,然后在上面搭一个智慧體編排層。看起来像魔法一樣。

问題在於,这正是大模型实验室正在透过 Cowork 和 Codex 做的事。很顯然,它們擁有模型,这意味著它們有更好的利潤率、更強的控制力,也能对所有下游參与者施加定价權。但或許更关鍵的是,它們还掌握著決定产品适合解決什麼问題的架構选擇。到目前为止,它們一直非常有意地採用「模型 + 工具呼叫」的模式,而这恰恰是黄磚路上那些橫向、低步骤數量工作所需要的模式。即便一家創业公司能以某種方式超越 Codex 或 Claude Code,大模型实验室仍然擁有龐大的分发能力,以及 AI 领域最強的品牌光環。

如果你是一家 AI 应用公司,採用的是同一套打法:接入相同的聯結器,沒有下層子智慧體或配置,也沒有分发管道,那麼你很可能是在走一條通向虛无的路。

对創业公司来说,情況並不全是悲觀的。在黄磚路之外,仍然存在巨大的机会。創业公司可以在这些地方擁有客戶,並解決複雜问題。

这些公司正在構建智慧體體验:模型被編织进複雜的工具、自动化和整合網路中——換句話说,就是软體。这也使得大多數这類創业公司天然是垂直化的。它們可以專注於多步骤、多參与方的工作流,針对不同角色和垂直场景设计子智慧體,處理 Anthropic 和 OpenAI 的橫向平台难以觸达的问題:跨系统收集上下文,再把任務路由給多个需要在不同階段審批的人。

这類工作通常会涉及一个或多个遺留系统,往往需要確定性結果,因为模糊性不可接受,而且有时还会直接繫結某个关鍵的商业結果。大模型实验室当然知道这些问題有多有价值:这就是为什麼它們正在搭建自己的外包式配置團队,也是为什麼整个面向大客戶的強化学習服務公司群體正在出现。

对上面觀点的一个反駁是:到目前为止,賭模型或实验室不会继续进步,一直是一筆很糟糕的交易。它們很可能会持续變強,並最終吃掉这些应用層公司所服務的市场。

大模型实验室当然会继续进步。但我认为,奧茲国其他地方的公司,长期来看仍然有幾種防守方式。

很多你在业務中真正內化的东西,並不存在於任何訓練集中:不成文的产业慣例、沒有檔案記錄的標準、存在於从业者腦子裡的部落知识。它們都不在公开網际網路上。无論投入多少訓練算力,都无法替代真正进入这些知识所在的工作流內部。

这裡疊加了两个飞輪:一个是跨客戶飞輪,也就是当你见过同一類问題的更多變體后,模式会不斷複利;另一个是客戶內部飞輪,也就是具體決策背后的原因、那些沒有明说的例外、公司自身的经验法則,只有在使用者与系统真实互动时才会浮现。

黄磚路陷阱:橫向工具必死之路

即便客戶资料不能跨客戶使用,应用公司仍然可以利用对不同客戶问題型別的模式识別,並用它来指導未来问題的架構设计。一家公司如果已经让自己的智慧體處理过一百次法律紅線修改、一千輪保险核保週期,或一万次 SDR 销售开发活动,它对问題形態的理解,已经不是一个后来者第一次啟动新智慧體就能複製的。

理論上,一个橫向智慧體也可以建立同樣的学習基礎设施。但它沒有这麼做的原因,除了專注度不足以外,更关鍵的是使用者體验。捕捉这種知识,完全取決於你給使用者提供了什麼樣的工作流介面。垂直玩家可以圍繞特定工作流真正需要暴露的资訊来设计这些介面,橫向工具做不到。評估集、標註输出、边界案例分類體系,都可以複合成一个垂直领域的资料飞輪,並进一步支援微调。后来者如果沒有同等規模的生产環境暴露,就很难生成这種飞輪。它是否可行,取決於资料權利、積累的生产使用量以及客戶合同結構,但模式识別本身仍然会不斷積累。

大模型实验室內部已经在做路由:針对不同请求呼叫不同類別的模型,在底層使用模型整合。但它們做不到的是跨供应商路由,也很难为了某个具體子任務評估競爭对手的模型,或在某个狹窄環節使用真正最合适的开源微调模型。

奧茲国其他地方的公司,会在整个模型市场中为每个子任務选擇最合适的模型,而不僅僅使用某个母实验室发布的模型。它們也会承擔那些沒人願意做的工作:每次新模型发布时重新跑評估、針对客戶的边界案例重新校準提示詞、在不破壞生产環境的情況下完成上線。大模型实验室不会替客戶做这些事。它們把新模型卖給你,然后告訴你去迁移。奧茲国其他地方的公司則吸收了迁移成本。客戶得到的是整个市场上最好的智慧能力,以及每次升級过程中的连续性。

把每个查詢都丟給 Opus 4.7,是让毛利率转负的最快路徑。最好的奧茲国公司会在不同層級的模型之间做路由:最难的任務交給前沿模型,大部分任務交給中等模型,在已经证明可行的地方使用更小的定製模型或微调模型。

其中一些公司现在已经在此基礎上做自己的后訓練,把模型最佳化到客戶真正关心的那一小段工作上,並以远低於前沿 API 呼叫的成本提供服務。大模型实验室为「地板价」定价:花 X 美元能买到的最低智慧水平。奧茲国公司卖的則是反过来的东西:在特定工作流真正需要的智慧水平下,实现最低美元成本。只有当你非常清楚每个子任務到底需要什麼級別的智慧时,这才可能做到。而大模型实验室在結構上不可能瞭解每一个垂直产业裡的每个任務。最終,这会直接转化为更低、更可控的結果定价。

成为客戶在某个垂直领域執行 AI 的控制平面,会产生相当大的价值。这个控制平面,是許可權、審计、智慧體被允許做什麼、智慧體实际做了什麼匯聚在一起的地方。

这一控制平面建立在具體用例的護欄之上,而不同产业、不同崗位型別中的護欄完全不同。因为这些公司端到端擁有智慧體接觸的工具、工作流和资料,它們能夠以橫向工具难以实现的方式提供確定性結果。它們也会替最終买方吸收監管複雜性:法律领域的美国聯邦民事訴訟規則和律師執业規則,醫療领域的 HIPAA,金融领域的 SEC 和 FINRA 規則,州級保险監管,等等。橫向玩家如果不把自己變成一百个不同的垂直产业,就无法令人信服地做到这一点。CIO 需要的是一个能夠在合同中明確承諾:它会为所提供的智慧體承擔合規處理责任的合作伙伴。

所有这些最終都回到同一件事:專注。

这種專注可以是一个垂直产业,比如保险、法律、会计;也可以是一个被做得足夠深的職能,比如销售、客服、财務。无論哪一種,这項工作都需要一个團队长期紮在同一類客戶群體中,理解它的工作流、边界案例和監管要求。大模型实验室並不是为此而建的。它們必須服務所有人、覆蓋所有地方,这也是它們最初修建黄磚路的原因。同樣的取捨,也会让它們难以进入奧茲国的其他地方:你可以同时无處不在,也可以在一件事上做到極致,但不能两者兼得。

在实踐中,应該如何理解这件事?以下是 11x CEO Prabhav Jain 給出的一些实操建议。

奧茲国机会:垂直工作流護城河

建立一家能夠抵禦大模型实验室衝擊的公司,一个可行的戰術路徑,是从客戶真正关心的具體結果出发。对我們来说,这个結果就是幫助企业产生更多销售線索和销售管道。

从这裡开始,问題就会變得非常具體:哪些活动是我們想要端到端擁有、並且確实能推动销售管道增长的?把每項活动拆解成任務。哪些任務适合智慧體,哪些不适合?哪些需要複雜的领域洞察,哪些不需要?大模型实验室也会推出工作流,但当一个工作流步骤很多、输入混亂、狀態难以解釋,或者存在现实世界约束时,僅僅有一个更好的模型並不能把事情做成。这时,工作又回到了傳统的软體工程,而在这个層面上,大模型实验室相较一家專注的应用公司並沒有優勢。

舉例来说,我們處理的一些任務包括:基於自定義訊號进行潛在客戶挖掘、潛在客戶资訊補全、深度帳戶研究、从 CRM 抓取上下文、針对不同管道撰寫资訊、潛在客戶资格判斷智慧體,以及郵件送达系统。其中有些是智慧體任務,有些不是。这些任務不是一次提示就能完成的,而是需要深度工程能力。

奧茲国这个類比中的关鍵洞察是:任何真实工作流中,粗略来看有一半是非智慧體任務,而这一半並不帶来实验室優勢。在模型層之下,它們編寫確定性软體的能力並不比你強。而另一半智慧體任務,也仍然要求你圍繞真正想要的結果,对模型进行调優、訓練和约束。

领域知识往往不在通用訓練资料中。这些能力必須从垂直产业或具體職能中自下而上構建,並在工作流中合适的时刻餵給模型。当我們的智慧體透过电話判斷一个入站線索是否合格时,它必須被訓練成理解:对特定产业、特定使用者畫像来说,什麼才是一场好的销售对話。这是应用公司要做的工作,而且这種能力会複利。

更关鍵的是,这些能力会不斷过时,因为企业本身也在演化。因此,你持续演化工作流和上下文的能力,本身就会成为競爭優勢。比如,当我們剛开始做規模化郵件外聯产品时,「AI 寫的郵件」才剛剛开始出现。快进到今天,人們已经形成了一種敏锐感覺,能夠分辨哪些郵件是 AI 寫的、哪些更像人寫的,而且关鍵在於,这種判斷每隔幾个月就会變化。我們的智慧體必須随著市场动態不斷调整,但護城河也正是在这裡建立起来的。事实上,儘管存在这種动態變化,我們的積極回覆率在过去幾个月裡提高了 4 倍,併为客戶創造了數亿美元的销售管道。

複雜问題才是真正釋放商业价值的地方。否則,你很容易发现自己只是在做一个薄薄的包裝層。

拆解任何足夠複雜的商业问題,很快就会看到混亂出现。这裡有一个来自 GTM 领域、聽起来很簡單的例子:如果某家公司已经是你的客戶,你就不应該再去聯絡这家公司裡的某个聯絡人。但这件事一点也不簡單。

也許你的 CRM 中有这家公司对应的域名。那麼,那些擁有幾十家子公司的公司怎麼辦?如果 CRM 記錄的是母公司的域名怎麼辦?如果 Salesforce 中一个过时的匹配欄位,導致你向现有客戶的首席營收官发出冷啟动销售郵件怎麼辦?真实世界的资料就是混亂的。人類處理起来都会吃力,模型也不会神奇地越过这道门檻。要从这種混亂中建立秩序,需要圍繞问題的具體形態设计專门的智慧體,而不是把一个通用副駕駛指向 CRM 就結束了。事实上,基於我們掌握的资料,我們发现自己的资料质量和新鮮度已经高於客戶自身,因此预设情況下,我們会以自己的资料为錨。

護欄被嚴重低估了。即便在同一个产品內部,每个用例也都需要自己的護欄。对我們来说,一个受監管的金融服務潛在客戶,与一箇中型 SaaS 客戶所要求的保证完全不同。而这些保证会層層傳導到智慧體如何书寫、可以聯絡誰、可以接觸哪些资料、可以在电話中说什麼,以及每个決策如何被記錄。

一套「一刀切」的系统会在这種差異面前崩潰。護欄必須按用例構建、按客戶配置,並且持续審计,而这些工作完全落在应用公司身上。这也是为什麼我們需要前線部署工程師和技術部署策略師,針对每个客戶的要求进行调優。

成本優勢:模型路由与后訓練

舉例来说,我們曾与一家财富 1000 強机構合作,透过语音对其龐大的 SMB 客戶群进行经同意的外呼。最初幾輪嘗試中,接聽率很低。我們必須快速迭代,学習如何在通話前 10 秒內让这類特定受眾产生互动。SMB 企业主的行为方式,与大型 B2B 买家或消费者完全不同。现在,我們一天为他們創造的销售机会,已经超过其整个销售團队在該細分市场一个月所能創造的數量。

销售只是一个例子。保险是另一个例子,它从不同角度说明瞭同一件事。以下是 FurtherAI CEO Aman Gour 对「离开黄磚路建设」的理解。

当我們开始把 AI 部署进真实的保险營运中时,反覆聽到一个假设:模型才是智慧,工作流只是圍繞模型搭建的腳手架。

但我們合作的保险公司越多,就越確信这件事正好相反。

在保险产业,很多智慧本身就存在於工作流之中。两家保险公司可以让一份提交材料走过看起来相同的路徑:提交、稽核、报价、承保。路徑本身是容易的。真正区分两家保险公司的,是路徑內部的所有东西:哪些风险需要升級,哪些損失訊號关鍵,当两條承保偏好規則衝突时哪一條優先,什麼时候必須由人類簽字確认,需要调取哪些外部资料,以及最終決策如何被記錄。

这些逻辑並不存在於一个乾淨的規則引擎中。它們分散在標準操作流程、经理稽核、核保哲学、保险公司特定的风险偏好,以及多年營运经验中。其中很多並沒有以模型可以直接读取的形式寫下来。

这就是为什麼我們不相信那種每次都从零开始推理的純智慧體,也不相信那種一遇到现实複雜性就会崩潰的剛性工作流。相反,我們一直在構建智慧體工作流。工作流帶来可重複性、可審计性和成本控制;智慧體處理變动性,並在理想路徑中斷时恢復流程;人類則在那些涉及判斷和问责的地方保持在環。

第一天,这套系统自动化的是人工工作。但随著时间推移,每一次升級都会成为一个訊號,每一个例外都是一次反饋,每一次人類修正都在告訴你原来的操作手冊哪裡不完整。久而久之,工作流不再只是一段指令碼,而会變成保险公司的營运記憶。

这正是大模型实验室难以觸达的部分。它們会继续发布更好的模型和更好的通用智慧體,而且它們也应該这麼做。但它們不会长期待在一家保险公司的生产工作流裡,去学習为什麼某个帳戶被升級,为什麼某个风险被拒絕,或者为什麼某个核保人推翻了风险偏好指南,而且事实证明他是对的。

这種理解,只能来自在生产環境中把同一套工作流執行成千上万次。你第一天交付的工作流並不是護城河。生产使用随著时间形成的迴圈,才是護城河。

对我們来说,这就是「离开黄磚路建设」的含義。

控制平面:合規与治理价值

这項工作需要多少步骤?为了支援它,你需要構建的工具有多複雜?

拿一个橫向 AI 在 Google Drive 中搜索作比较:它是針对一个工具的一步操作,結果容错率也很高。使用者读完摘要,如果错了,再问一次就行。

再看一个基於律所过去三年先例进行多步骤法律紅線修改的任務:它可能涉及幾十个步骤、多个工具,输出必須透过合夥人審查,甚至可能需要在法庭上被論证。两者看起来都像是「一个智慧體在做事」,但只有后者需要那種由專注團队花多年时间構建的深度软體。

你是在構建一个客戶用来執行工作的系统,还是在客戶已有系统之上增加一个工具?

系统擁有端到端工作流:资料捕捉、治理、工作完成記錄。客戶在描述实际工作如何发生时,会指向这个系统。工具則只是給客戶已经在執行的工作流增加一層智慧。

工具型产品也可以产生真实收入,但大模型实验室更容易把它拿走,因为客戶並不依賴你作为編排層。高 ACV 通常是系统型产品的訊號,因为系统替代的是真实人力,也因此能獲得相应付费。但这並不是絕对保证。你需要问自己:如果某个大模型实验室推出了一个看似与你直接競爭的产品,客戶是否仍然需要你的工具?如果答案是需要,你在構建的是系统。如果答案是不需要,你就是一个工具——即使你的 ACV 很高。

大模型实验室的表现,是用基準測試来評判的;奧茲国其他地方公司的表现,則是用客戶的損益表来評判的。

客戶並不关心你的模型在 SWE-Bench 或 MMLU 上得了多少分。他們关心的是:你的智慧體是否成交了訂單,是否正確修改了合同紅線,是否承保了正確的保單。如果客戶关注的是特定工作流結果,而不是通用能力分數,你就在奧茲国的其他地方。如果客戶付钱买的是通用能力,那你卖的就是他們可以透过 Claude 或 Codex 席位獲得的东西。

最好的智慧體公司需要像避险基金一樣執行:它們贏在 alpha,而 alpha 是在客戶損益表中衡量的,不是在基準測試分數中衡量的。

我們將会在黄磚路上和黄磚路之外同时看到巨大的贏家。模型会继续獲勝,因为它們擁有模型,也擁有为橫向工具设计好的分发能力。

奧茲国的其他地方也能贏,前提是它們擁有工作的系统:也就是企业实际執行工作的介面,以及从中流动並被捕捉的资料。这些公司擁有资料捕捉、工作流行动系统和治理。随著某个垂直领域中的複雜工作流逐漸成熟,它們会複合成一種客戶离不开的核心體验。随著既有玩家和新进入者不斷发布新一代模型,这家公司会成为把这些模型整合並交付給客戶的那一層。底層模型是可替換的,但工作的系统不是。

下一代企业软體,將会在黄磚路之外被建立起来。

查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论