OpenAI狂吃应用层？a16z：机会在「黄砖路」之外，创业者机会还在后面

Question

a16z合夥人指出，AI应用層並非單一戰场，創业公司应避开大模型公司直攻的橫向工具，转向垂直产业深耕。本文源自推特貼文。
（前情提要：Google 领投 AI 路由平台 OpenRouter，估值 13 亿美元一年成长 240%）
（背景補充：Sam Altman 对談 a16z 創辦人：OpenAI 將激进押注基礎设施，Sora 是重要戰略工具）

本文目錄

Toggle

焦慮蔓延：大模型吞噬应用層？
黄磚路陷阱：橫向工具必死之路
奧茲国机会：垂直工作流護城河
成本優勢：模型路由与后訓練
控制平面：合規与治理价值

这正是 a16z 合夥人 Joe Schmidt 在这篇文章中試圖回答的问題。他借用《綠野仙蹤》中的「黄磚路」作比喻，將 AI 应用机会分成两類：一類是大模型公司正在親自进入的主路，比如程式碼生成、寫作、影像生成、通用型 Agent 和橫向辦公助手；另一類則是「奧茲国的其他地方」，也就是那些深入产业流程、依賴複雜工作流、资料沉澱、合規治理和系统整合能力的垂直场景。

在他看来，創业公司真正的机会在后者。

从销售到保险，Joe Schmidt 反覆強调同一个逻辑：企业真正願意付费的，不是一个更聰明的聊天視窗，而是一个能对业務結果负责的系统。它需要理解客戶资料的混亂狀態，處理多人審批和边界案例，承擔合規与審计责任，也要在模型不斷升級时，替客戶完成迁移、路由和成本最佳化。

这也是本文对下一代企业软體的核心判斷：底層模型会越来越強，也会變得越来越可替換；但真正不可替代的，是圍繞具體产业和具體工作流沉澱下来的资料、流程、治理能力与營运記憶。AI 应用公司的机会，不在於与模型公司爭奪「黄磚路」，而在於走进那些更復雜、更髒、更慢，但也更接近真实商业价值的地方。

最近，我不斷从創始人和潛在員工那裡聽到同一个问題：AI 应用層还有什麼可做的嗎？还是说，OpenAI 和 Anthropic 最終会殺死一切？

这个问題背后有一種很典型的 AI 式焦慮。有人已经得出結論：如果不想淪为永久性的底層，唯一有长期价值的位置，要麼是在大模型实验室內部，要麼是在机器人、硬科技或類似前沿领域創业——理論上，也就是去做那些「实验室碰不到」的东西。因为如果每一類软體都將被吞噬，要麼被 Codex 或 Claude 直接吸收掉对应工作，要麼被未来某个模型變得不再必要，那最好的选擇似乎就是：快跑！

我承认，自己幾乎也是一个 AI 極大主義者，而且我认为他們说对了一半。大模型实验室確实正在进入应用層的大片区域。但「应用層」並不是一个同质化的机会集合。真正关鍵的判斷標準是：你是在走「黄磚路」，还是在奧茲国的其他地方。

注：「黄磚路」是《綠野仙蹤》裡通往奧茲国翡翠城核心地帶、去见「魔法師」的主路。

所謂「黄磚路」，是我們用来形容大模型实验室正在走、並投入巨大资源的那條路徑。程式碼生成、寫作、影像創作这類问題之所以天然适合实验室来做，是因为它們会随著模型原始能力的提升而變得更好：每一美元投入到预訓練和后訓練中，都会直接改善产品质量。

但奧茲国的其他地方，存在著更復雜、通常也更垂直的问題。它們並不是簡單地給一个企业使用者提供一个橫向工具，让它接入標準工具和电腦操作能力就能解決。这裡的价值，更多来自模型周圍的腳手架：这些腳手架让输出在特定产业中變得可信、合規，並能真正进入业務流程。底層模型的原始能力当然仍然关鍵，但已经不是全部。

我們正在即时看到这一点。OpenAI 和 Anthropic 实际上正在向市场承认：它們无法用一个通用的 AI 同事解決所有问題。它們已经宣布投入大規模的前線部署式合资專案，圍繞为企业配置和定製模型来搭建完整公司。如果它們真的认为下一次模型发布就能解決这些问題，就不会向这類專案投入數十亿美元。

焦慮蔓延：大模型吞噬应用層？

所以，如果你想靠做 AI 应用賺钱，就不要走黄磚路，而要去奧茲国的其他地方建设。以下是我們以及我們投资組閤中的一些創始人，在实踐中学到的经验。

如果你要創辦一家公司，黄磚路是最顯眼的一條路，但也是最危险的一條路。拿一个高效能模型，接上一些现成的聯結器，比如 Google Drive、Slack、Salesforce、Notion、GitHub，然后在上面搭一个智慧體編排層。看起来像魔法一樣。

问題在於，这正是大模型实验室正在透过 Cowork 和 Codex 做的事。很顯然，它們擁有模型，这意味著它們有更好的利潤率、更強的控制力，也能对所有下游參与者施加定价權。但或許更关鍵的是，它們还掌握著決定产品适合解決什麼问題的架構选擇。到目前为止，它們一直非常有意地採用「模型 + 工具呼叫」的模式，而这恰恰是黄磚路上那些橫向、低步骤數量工作所需要的模式。即便一家創业公司能以某種方式超越 Codex 或 Claude Code，大模型实验室仍然擁有龐大的分发能力，以及 AI 领域最強的品牌光環。

如果你是一家 AI 应用公司，採用的是同一套打法：接入相同的聯結器，沒有下層子智慧體或配置，也沒有分发管道，那麼你很可能是在走一條通向虛无的路。

对創业公司来说，情況並不全是悲觀的。在黄磚路之外，仍然存在巨大的机会。創业公司可以在这些地方擁有客戶，並解決複雜问題。

这些公司正在構建智慧體體验：模型被編织进複雜的工具、自动化和整合網路中——換句話说，就是软體。这也使得大多數这類創业公司天然是垂直化的。它們可以專注於多步骤、多參与方的工作流，針对不同角色和垂直场景设计子智慧體，處理 Anthropic 和 OpenAI 的橫向平台难以觸达的问題：跨系统收集上下文，再把任務路由給多个需要在不同階段審批的人。

这類工作通常会涉及一个或多个遺留系统，往往需要確定性結果，因为模糊性不可接受，而且有时还会直接繫結某个关鍵的商业結果。大模型实验室当然知道这些问題有多有价值：这就是为什麼它們正在搭建自己的外包式配置團队，也是为什麼整个面向大客戶的強化学習服務公司群體正在出现。

对上面觀点的一个反駁是：到目前为止，賭模型或实验室不会继续进步，一直是一筆很糟糕的交易。它們很可能会持续變強，並最終吃掉这些应用層公司所服務的市场。

大模型实验室当然会继续进步。但我认为，奧茲国其他地方的公司，长期来看仍然有幾種防守方式。

很多你在业務中真正內化的东西，並不存在於任何訓練集中：不成文的产业慣例、沒有檔案記錄的標準、存在於从业者腦子裡的部落知识。它們都不在公开網际網路上。无論投入多少訓練算力，都无法替代真正进入这些知识所在的工作流內部。

这裡疊加了两个飞輪：一个是跨客戶飞輪，也就是当你见过同一類问題的更多變體后，模式会不斷複利；另一个是客戶內部飞輪，也就是具體決策背后的原因、那些沒有明说的例外、公司自身的经验法則，只有在使用者与系统真实互动时才会浮现。

黄磚路陷阱：橫向工具必死之路

即便客戶资料不能跨客戶使用，应用公司仍然可以利用对不同客戶问題型別的模式识別，並用它来指導未来问題的架構设计。一家公司如果已经让自己的智慧體處理过一百次法律紅線修改、一千輪保险核保週期，或一万次 SDR 销售开发活动，它对问題形態的理解，已经不是一个后来者第一次啟动新智慧體就能複製的。

理論上，一个橫向智慧體也可以建立同樣的学習基礎设施。但它沒有这麼做的原因，除了專注度不足以外，更关鍵的是使用者體验。捕捉这種知识，完全取決於你給使用者提供了什麼樣的工作流介面。垂直玩家可以圍繞特定工作流真正需要暴露的资訊来设计这些介面，橫向工具做不到。評估集、標註输出、边界案例分類體系，都可以複合成一个垂直领域的资料飞輪，並进一步支援微调。后来者如果沒有同等規模的生产環境暴露，就很难生成这種飞輪。它是否可行，取決於资料權利、積累的生产使用量以及客戶合同結構，但模式识別本身仍然会不斷積累。

大模型实验室內部已经在做路由：針对不同请求呼叫不同類別的模型，在底層使用模型整合。但它們做不到的是跨供应商路由，也很难为了某个具體子任務評估競爭对手的模型，或在某个狹窄環節使用真正最合适的开源微调模型。

奧茲国其他地方的公司，会在整个模型市场中为每个子任務选擇最合适的模型，而不僅僅使用某个母实验室发布的模型。它們也会承擔那些沒人願意做的工作：每次新模型发布时重新跑評估、針对客戶的边界案例重新校準提示詞、在不破壞生产環境的情況下完成上線。大模型实验室不会替客戶做这些事。它們把新模型卖給你，然后告訴你去迁移。奧茲国其他地方的公司則吸收了迁移成本。客戶得到的是整个市场上最好的智慧能力，以及每次升級过程中的连续性。

把每个查詢都丟給 Opus 4.7，是让毛利率转负的最快路徑。最好的奧茲国公司会在不同層級的模型之间做路由：最难的任務交給前沿模型，大部分任務交給中等模型，在已经证明可行的地方使用更小的定製模型或微调模型。

其中一些公司现在已经在此基礎上做自己的后訓練，把模型最佳化到客戶真正关心的那一小段工作上，並以远低於前沿 API 呼叫的成本提供服務。大模型实验室为「地板价」定价：花 X 美元能买到的最低智慧水平。奧茲国公司卖的則是反过来的东西：在特定工作流真正需要的智慧水平下，实现最低美元成本。只有当你非常清楚每个子任務到底需要什麼級別的智慧时，这才可能做到。而大模型实验室在結構上不可能瞭解每一个垂直产业裡的每个任務。最終，这会直接转化为更低、更可控的結果定价。

成为客戶在某个垂直领域執行 AI 的控制平面，会产生相当大的价值。这个控制平面，是許可權、審计、智慧體被允許做什麼、智慧體实际做了什麼匯聚在一起的地方。

这一控制平面建立在具體用例的護欄之上，而不同产业、不同崗位型別中的護欄完全不同。因为这些公司端到端擁有智慧體接觸的工具、工作流和资料，它們能夠以橫向工具难以实现的方式提供確定性結果。它們也会替最終买方吸收監管複雜性：法律领域的美国聯邦民事訴訟規則和律師執业規則，醫療领域的 HIPAA，金融领域的 SEC 和 FINRA 規則，州級保险監管，等等。橫向玩家如果不把自己變成一百个不同的垂直产业，就无法令人信服地做到这一点。CIO 需要的是一个能夠在合同中明確承諾：它会为所提供的智慧體承擔合規處理责任的合作伙伴。

所有这些最終都回到同一件事：專注。

这種專注可以是一个垂直产业，比如保险、法律、会计；也可以是一个被做得足夠深的職能，比如销售、客服、财務。无論哪一種，这項工作都需要一个團队长期紮在同一類客戶群體中，理解它的工作流、边界案例和監管要求。大模型实验室並不是为此而建的。它們必須服務所有人、覆蓋所有地方，这也是它們最初修建黄磚路的原因。同樣的取捨，也会让它們难以进入奧茲国的其他地方：你可以同时无處不在，也可以在一件事上做到極致，但不能两者兼得。

在实踐中，应該如何理解这件事？以下是 11x CEO Prabhav Jain 給出的一些实操建议。

奧茲国机会：垂直工作流護城河

建立一家能夠抵禦大模型实验室衝擊的公司，一个可行的戰術路徑，是从客戶真正关心的具體結果出发。对我們来说，这个結果就是幫助企业产生更多销售線索和销售管道。

从这裡开始，问題就会變得非常具體：哪些活动是我們想要端到端擁有、並且確实能推动销售管道增长的？把每項活动拆解成任務。哪些任務适合智慧體，哪些不适合？哪些需要複雜的领域洞察，哪些不需要？大模型实验室也会推出工作流，但当一个工作流步骤很多、输入混亂、狀態难以解釋，或者存在现实世界约束时，僅僅有一个更好的模型並不能把事情做成。这时，工作又回到了傳统的软體工程，而在这个層面上，大模型实验室相较一家專注的应用公司並沒有優勢。

舉例来说，我們處理的一些任務包括：基於自定義訊號进行潛在客戶挖掘、潛在客戶资訊補全、深度帳戶研究、从 CRM 抓取上下文、針对不同管道撰寫资訊、潛在客戶资格判斷智慧體，以及郵件送达系统。其中有些是智慧體任務，有些不是。这些任務不是一次提示就能完成的，而是需要深度工程能力。

奧茲国这个類比中的关鍵洞察是：任何真实工作流中，粗略来看有一半是非智慧體任務，而这一半並不帶来实验室優勢。在模型層之下，它們編寫確定性软體的能力並不比你強。而另一半智慧體任務，也仍然要求你圍繞真正想要的結果，对模型进行调優、訓練和约束。

领域知识往往不在通用訓練资料中。这些能力必須从垂直产业或具體職能中自下而上構建，並在工作流中合适的时刻餵給模型。当我們的智慧體透过电話判斷一个入站線索是否合格时，它必須被訓練成理解：对特定产业、特定使用者畫像来说，什麼才是一场好的销售对話。这是应用公司要做的工作，而且这種能力会複利。

更关鍵的是，这些能力会不斷过时，因为企业本身也在演化。因此，你持续演化工作流和上下文的能力，本身就会成为競爭優勢。比如，当我們剛开始做規模化郵件外聯产品时，「AI 寫的郵件」才剛剛开始出现。快进到今天，人們已经形成了一種敏锐感覺，能夠分辨哪些郵件是 AI 寫的、哪些更像人寫的，而且关鍵在於，这種判斷每隔幾个月就会變化。我們的智慧體必須随著市场动態不斷调整，但護城河也正是在这裡建立起来的。事实上，儘管存在这種动態變化，我們的積極回覆率在过去幾个月裡提高了 4 倍，併为客戶創造了數亿美元的销售管道。

複雜问題才是真正釋放商业价值的地方。否則，你很容易发现自己只是在做一个薄薄的包裝層。

拆解任何足夠複雜的商业问題，很快就会看到混亂出现。这裡有一个来自 GTM 领域、聽起来很簡單的例子：如果某家公司已经是你的客戶，你就不应該再去聯絡这家公司裡的某个聯絡人。但这件事一点也不簡單。

也許你的 CRM 中有这家公司对应的域名。那麼，那些擁有幾十家子公司的公司怎麼辦？如果 CRM 記錄的是母公司的域名怎麼辦？如果 Salesforce 中一个过时的匹配欄位，導致你向现有客戶的首席營收官发出冷啟动销售郵件怎麼辦？真实世界的资料就是混亂的。人類處理起来都会吃力，模型也不会神奇地越过这道门檻。要从这種混亂中建立秩序，需要圍繞问題的具體形態设计專门的智慧體，而不是把一个通用副駕駛指向 CRM 就結束了。事实上，基於我們掌握的资料，我們发现自己的资料质量和新鮮度已经高於客戶自身，因此预设情況下，我們会以自己的资料为錨。

護欄被嚴重低估了。即便在同一个产品內部，每个用例也都需要自己的護欄。对我們来说，一个受監管的金融服務潛在客戶，与一箇中型 SaaS 客戶所要求的保证完全不同。而这些保证会層層傳導到智慧體如何书寫、可以聯絡誰、可以接觸哪些资料、可以在电話中说什麼，以及每个決策如何被記錄。

一套「一刀切」的系统会在这種差異面前崩潰。護欄必須按用例構建、按客戶配置，並且持续審计，而这些工作完全落在应用公司身上。这也是为什麼我們需要前線部署工程師和技術部署策略師，針对每个客戶的要求进行调優。

成本優勢：模型路由与后訓練

舉例来说，我們曾与一家财富 1000 強机構合作，透过语音对其龐大的 SMB 客戶群进行经同意的外呼。最初幾輪嘗試中，接聽率很低。我們必須快速迭代，学習如何在通話前 10 秒內让这類特定受眾产生互动。SMB 企业主的行为方式，与大型 B2B 买家或消费者完全不同。现在，我們一天为他們創造的销售机会，已经超过其整个销售團队在該細分市场一个月所能創造的數量。

销售只是一个例子。保险是另一个例子，它从不同角度说明瞭同一件事。以下是 FurtherAI CEO Aman Gour 对「离开黄磚路建设」的理解。

当我們开始把 AI 部署进真实的保险營运中时，反覆聽到一个假设：模型才是智慧，工作流只是圍繞模型搭建的腳手架。

但我們合作的保险公司越多，就越確信这件事正好相反。

在保险产业，很多智慧本身就存在於工作流之中。两家保险公司可以让一份提交材料走过看起来相同的路徑：提交、稽核、报价、承保。路徑本身是容易的。真正区分两家保险公司的，是路徑內部的所有东西：哪些风险需要升級，哪些損失訊號关鍵，当两條承保偏好規則衝突时哪一條優先，什麼时候必須由人類簽字確认，需要调取哪些外部资料，以及最終決策如何被記錄。

这些逻辑並不存在於一个乾淨的規則引擎中。它們分散在標準操作流程、经理稽核、核保哲学、保险公司特定的风险偏好，以及多年營运经验中。其中很多並沒有以模型可以直接读取的形式寫下来。

这就是为什麼我們不相信那種每次都从零开始推理的純智慧體，也不相信那種一遇到现实複雜性就会崩潰的剛性工作流。相反，我們一直在構建智慧體工作流。工作流帶来可重複性、可審计性和成本控制；智慧體處理變动性，並在理想路徑中斷时恢復流程；人類則在那些涉及判斷和问责的地方保持在環。

第一天，这套系统自动化的是人工工作。但随著时间推移，每一次升級都会成为一个訊號，每一个例外都是一次反饋，每一次人類修正都在告訴你原来的操作手冊哪裡不完整。久而久之，工作流不再只是一段指令碼，而会變成保险公司的營运記憶。

这正是大模型实验室难以觸达的部分。它們会继续发布更好的模型和更好的通用智慧體，而且它們也应該这麼做。但它們不会长期待在一家保险公司的生产工作流裡，去学習为什麼某个帳戶被升級，为什麼某个风险被拒絕，或者为什麼某个核保人推翻了风险偏好指南，而且事实证明他是对的。

这種理解，只能来自在生产環境中把同一套工作流執行成千上万次。你第一天交付的工作流並不是護城河。生产使用随著时间形成的迴圈，才是護城河。

对我們来说，这就是「离开黄磚路建设」的含義。

控制平面：合規与治理价值

这項工作需要多少步骤？为了支援它，你需要構建的工具有多複雜？

拿一个橫向 AI 在 Google Drive 中搜索作比较：它是針对一个工具的一步操作，結果容错率也很高。使用者读完摘要，如果错了，再问一次就行。

再看一个基於律所过去三年先例进行多步骤法律紅線修改的任務：它可能涉及幾十个步骤、多个工具，输出必須透过合夥人審查，甚至可能需要在法庭上被論证。两者看起来都像是「一个智慧體在做事」，但只有后者需要那種由專注團队花多年时间構建的深度软體。

你是在構建一个客戶用来執行工作的系统，还是在客戶已有系统之上增加一个工具？

系统擁有端到端工作流：资料捕捉、治理、工作完成記錄。客戶在描述实际工作如何发生时，会指向这个系统。工具則只是給客戶已经在執行的工作流增加一層智慧。

工具型产品也可以产生真实收入，但大模型实验室更容易把它拿走，因为客戶並不依賴你作为編排層。高 ACV 通常是系统型产品的訊號，因为系统替代的是真实人力，也因此能獲得相应付费。但这並不是絕对保证。你需要问自己：如果某个大模型实验室推出了一个看似与你直接競爭的产品，客戶是否仍然需要你的工具？如果答案是需要，你在構建的是系统。如果答案是不需要，你就是一个工具——即使你的 ACV 很高。

大模型实验室的表现，是用基準測試来評判的；奧茲国其他地方公司的表现，則是用客戶的損益表来評判的。

客戶並不关心你的模型在 SWE-Bench 或 MMLU 上得了多少分。他們关心的是：你的智慧體是否成交了訂單，是否正確修改了合同紅線，是否承保了正確的保單。如果客戶关注的是特定工作流結果，而不是通用能力分數，你就在奧茲国的其他地方。如果客戶付钱买的是通用能力，那你卖的就是他們可以透过 Claude 或 Codex 席位獲得的东西。

最好的智慧體公司需要像避险基金一樣執行：它們贏在 alpha，而 alpha 是在客戶損益表中衡量的，不是在基準測試分數中衡量的。

我們將会在黄磚路上和黄磚路之外同时看到巨大的贏家。模型会继续獲勝，因为它們擁有模型，也擁有为橫向工具设计好的分发能力。

奧茲国的其他地方也能贏，前提是它們擁有工作的系统：也就是企业实际執行工作的介面，以及从中流动並被捕捉的资料。这些公司擁有资料捕捉、工作流行动系统和治理。随著某个垂直领域中的複雜工作流逐漸成熟，它們会複合成一種客戶离不开的核心體验。随著既有玩家和新进入者不斷发布新一代模型，这家公司会成为把这些模型整合並交付給客戶的那一層。底層模型是可替換的，但工作的系统不是。

下一代企业软體，將会在黄磚路之外被建立起来。

查看原文

OpenAI狂吃应用层？a16z：机会在「黄砖路」之外，创业者机会还在后面

焦慮蔓延：大模型吞噬应用層？

黄磚路陷阱：橫向工具必死之路

奧茲国机会：垂直工作流護城河

成本優勢：模型路由与后訓練

控制平面：合規与治理价值

热门话题

成长值抽奖赢金条

24h加密合约清算破4亿美元

股票交易挑战最高赢17000U

美军对伊朗发动新打击

交易CFD送黄金

置顶