ChatGPT và Claude có thể sẽ thay thế nhiều công việc không?

a16z cộng sự Joe Schmidt IV chỉ ra rằng phòng thí nghiệm mô hình lớn sẽ chỉ dẫn đạo các nhiệm vụ ngang, cơ hội ứng dụng AI thực sự nằm trong các bối cảnh dọc và quy trình phức tạp.
(Tiền sử: Altman rút lại lời tiên tri "AI tiêu diệt công việc của loài người": Tôi rất vui vì mình đã sai, thật lòng sao? )
(Bổ sung nền tảng: Google đầu tư vào nền tảng định tuyến AI OpenRouter, định giá 13 tỷ USD, tăng trưởng 240% mỗi năm)

Mục lục bài viết

Toggle

  • Đường gạch vàng
  • Nơi khác của đất Oz
  • Tại sao các nơi khác của đất Oz không bị phù thủy chiếm đóng
  • Trường hợp lĩnh vực bán hàng — lời khuyên thực tiễn từ CEO của 11x
    • Tập trung vào kết quả
    • Tăng cường ở các vấn đề phức tạp
    • Hàng rào không chỉ để ngăn chặn điều xấu xảy ra, đó chính là lý do khách hàng trả tiền
  • Trường hợp lĩnh vực bảo hiểm — lời khuyên thực tiễn từ CEO của FurtherAI
  • Làm thế nào để bạn tự đánh giá mình có đang ở nơi khác của đất Oz không?
  • Cả hai đều có thể (và sẽ) chiến thắng

Nhà sáng lập và nhân viên tiềm năng luôn hỏi tôi cùng một câu hỏi: Còn chỗ nào đáng xây dựng trong lĩnh vực ứng dụng AI không? Hay OpenAI và Anthropic sẽ dập tắt tất cả?

Câu hỏi này ẩn chứa một dạng "lo lắng về AI" đặc biệt. Một số người đã kết luận rằng, để tránh trở thành tầng lớp thấp mãi mãi, nơi tồn tại lâu dài duy nhất là trong các phòng thí nghiệm lớn hoặc trong các lĩnh vực tiên phong như robot, công nghệ cứng — về lý thuyết là những thứ "không thể tiếp cận trong phòng thí nghiệm".

Nếu mọi phần mềm đều sắp bị nuốt chửng, dù là bị Codex hay Claude trực tiếp thay thế công việc, hay bị các mô hình tương lai làm cho mọi thứ bạn xây dựng trở nên vô nghĩa, thì hãy chạy đi!

Nghe này, tôi gần như cũng là người theo chủ nghĩa tối cao AI như tất cả mọi người, nhưng tôi nghĩ họ chỉ đúng một nửa. Phòng thí nghiệm thực sự đang xói mòn phần lớn bản đồ ứng dụng. Nhưng "lớp ứng dụng" không phải là một cơ hội đơn nhất và đồng nhất. Khung tư duy đúng là: bạn đang ở trên "Đường gạch vàng" của "Xứ sở thần tiên" (Yellow Brick Road), hay đang ở trong thế giới của các sinh linh khác của đất Oz?

Đường gạch vàng là cách chúng ta gọi tắt con đường mà các phòng thí nghiệm đang tiến bước, họ đầu tư nguồn lực khủng khiếp vào đó. Lý do phòng thí nghiệm phù hợp để giải quyết các vấn đề như tạo mã, viết lách hoặc tạo hình ảnh, là vì các vấn đề này có thể cải thiện theo sự nâng cao của "khả năng nguyên thủy của mô hình": mỗi đô la đầu tư vào huấn luyện trước và huấn luyện sau đều trực tiếp nâng cao chất lượng sản phẩm.

Trong khi đó, các nơi khác của đất Oz lại đầy các vấn đề phức tạp, thường là trong các lĩnh vực dọc. Những vấn đề này không đơn giản chỉ là cung cấp cho doanh nghiệp một "công cụ chung" có quyền truy cập máy tính và các công cụ tiêu chuẩn.

Giá trị của chúng không chỉ đến từ khả năng nguyên thủy của mô hình (dù điều này vẫn quan trọng!), mà còn đến từ khung hỗ trợ (scaffolding) bao quanh nó, chính những khung này khiến đầu ra trong ngành cụ thể trở nên đáng tin cậy, phù hợp quy định và có thể vận hành thực tế.

Chúng ta đang chứng kiến cảnh này diễn ra ngay trước mắt: OpenAI và Anthropic thực tế đang truyền tải một thông điệp tới thị trường: họ không thể dùng một đồng nghiệp AI chung chung để giải quyết mọi vấn đề. Họ đã công bố các kế hoạch hợp tác triển khai quy mô lớn, xây dựng toàn bộ công ty dựa trên việc cấu hình và tùy chỉnh mô hình cho doanh nghiệp. Nếu bạn nghĩ rằng chỉ cần ra mắt mô hình mới là mọi thứ sẽ xong, thì bạn chắc chắn sẽ không bỏ ra hàng tỷ đô la vào những dự án này.

Vì vậy, nếu bạn muốn làm giàu từ việc phát triển ứng dụng AI — hãy tránh đường gạch vàng, mà hãy đi vào các nơi khác của đất Oz để mở rộng. Dưới đây là những bài học mà chúng tôi và các nhà sáng lập trong danh mục đầu tư của chúng tôi đã đúc kết về điều gì mới là hiệu quả.

Đường gạch vàng

Nếu bạn muốn khởi nghiệp, đường gạch vàng là con đường rõ ràng nhất, nhưng cũng là con đường nguy hiểm nhất. Lấy một mô hình hiệu suất cao, cắm vào đó một số bộ kết nối sẵn có (như Google Drive, Slack, Salesforce, Notion, GitHub), rồi xây dựng một tầng Agent (tác nhân) điều phối dựa trên đó. Thật như phép thuật!

Vấn đề ở đây là, chính xác là những gì phòng thí nghiệm đang làm qua Cowork và Codex. Rõ ràng, họ sở hữu mô hình, điều này mang lại lợi nhuận cao hơn, kiểm soát tốt hơn, và khả năng định giá cho các nhà cung cấp hạ nguồn.

Nhưng có lẽ quan trọng nhất, họ còn nắm trong tay "lựa chọn khung kiến trúc" quyết định mô hình của họ có thể giải quyết vấn đề một cách hoàn hảo hay không. Cho đến nay, họ đã suy nghĩ kỹ về "mô hình cộng với gọi công cụ (tool calls)", chính là kiểu làm việc theo kiểu ngang, bước thấp mà đường gạch vàng yêu cầu. Ngay cả các startup có thể vượt qua Codex hoặc Claude Code ở một mức độ nào đó, thì phòng thí nghiệm vẫn có mạng lưới phân phối lớn và thương hiệu mạnh nhất trong lĩnh vực AI.

Nếu bạn là một công ty ứng dụng AI, bắt chước theo cách này, dùng cùng các bộ kết nối, mà không có sub-agent hay cấu hình sâu, cũng chẳng có kênh phân phối, thì rất có thể bạn đang đi trên con đường dẫn đến vực thẳm.

Các nơi khác của đất Oz

Với các startup, điều này không phải là tận cùng của mọi hy vọng. Ngoài đường gạch vàng vẫn còn những cơ hội lớn, các startup có thể rõ ràng định hướng để sở hữu khách hàng của riêng mình và giải quyết các vấn đề phức tạp.

Các công ty này đang xây dựng trải nghiệm Agent, kết hợp mô hình trong một mạng lưới phức tạp gồm công cụ, tự động hóa và tích hợp (tức là phần mềm), khiến phần lớn các startup này đều tập trung vào lĩnh vực dọc.

Họ có thể tập trung vào các công việc nhiều bước, phối hợp nhiều vai trò, và thiết lập các sub-agent cho các vai trò và lĩnh vực cụ thể — điều mà Anthropic và OpenAI không thể làm với nền tảng chung: thu thập ngữ cảnh xuyên hệ thống, rồi phân phối cho nhiều người cần phê duyệt ở các giai đoạn khác nhau.

Điều này thường liên quan đến một hoặc nhiều hệ thống cũ (legacy systems), đòi hỏi kết quả chính xác (không thể có chút mơ hồ nào), và thường gắn liền với các kết quả thương mại có giá trị cao.

Phòng thí nghiệm rõ ràng nhận thức rõ giá trị của những vấn đề này: chính vì vậy họ đang xây dựng các bộ phận cấu hình thuê ngoài của riêng mình, và tồn tại một loại hình dịch vụ học tăng cường (reinforcement learning) hướng tới thị trường cao cấp.

Tại sao các nơi khác của đất Oz không bị phù thủy chiếm đóng

Về quan điểm này, người ta phản bác rằng, cho đến nay, việc bán khống các mô hình/phòng thí nghiệm là một cược không sinh lợi. Họ có khả năng sẽ tiếp tục mạnh lên, và cuối cùng sẽ nuốt chửng thị trường của các doanh nghiệp lớp ứng dụng.

Phòng thí nghiệm tất nhiên sẽ tiếp tục tiến bộ, nhưng tôi nghĩ các doanh nghiệp ở các nơi khác của đất Oz theo thời gian có thể tự bảo vệ mình theo nhiều cách:

Vòng quay dữ liệu và học hỏi (Data and learning flywheel): Hầu hết những gì bạn nội tại hóa không nằm trong bất kỳ tập huấn nào — các quy chuẩn ngành chưa chính thức, các tiêu chuẩn chưa ghi chép, và trí tuệ tập thể tồn tại trong tâm trí của các chuyên gia. Những thứ này không thể tìm thấy trên các trang web công khai. Dù có nhiều sức mạnh huấn luyện đi nữa, cũng không thể thay thế được "quy trình làm việc" thực tế tồn tại trong các kiến thức này.

Có hai vòng quay liên kết chồng chất: một là vòng quay giữa các khách hàng (khi bạn thấy nhiều biến thể của cùng một vấn đề, mô hình sẽ sinh lợi theo cấp số nhân); và một là vòng quay nội bộ khách hàng (nguyên nhân đằng sau các quyết định, các ngoại lệ không nói rõ, và quy tắc kinh nghiệm của chính công ty — tất cả chỉ lộ ra qua tương tác thực tế với hệ thống).

Một công ty đã để Agent chạy qua 100 lần chỉnh sửa điều khoản pháp lý, 1000 chu kỳ thẩm định bảo hiểm hoặc 10.000 chiến dịch marketing SDR, đã nội tại hóa bản chất của vấn đề — điều mà các đối thủ mới bắt đầu tạo ra một Agent hoàn toàn mới không thể sao chép. Bộ đánh giá (Eval sets), phân loại đầu ra, phân loại các tình huống biên — tất cả hợp lại thành một vòng quay dữ liệu đặc thù của lĩnh vực, thúc đẩy quá trình tinh chỉnh (fine-tuning).

Biến thể và độ phức tạp của mô hình quản lý: Phòng thí nghiệm đã bắt đầu thực hiện phân luồng — sử dụng các mô hình khác nhau cho các yêu cầu khác nhau, tích hợp ở tầng dưới (ensembles). Nhưng họ không thể làm "phân luồng giữa các nhà cung cấp", hay đánh giá mô hình của đối thủ cạnh tranh cho các nhiệm vụ cụ thể, hoặc dùng các mô hình mã nguồn mở đã tinh chỉnh cho các phân đoạn phù hợp nhất. Các công ty ở các nơi khác của đất Oz sẽ chọn mô hình phù hợp nhất cho từng nhiệm vụ trong toàn thị trường mô hình.

Mỗi khi có mô hình mới ra đời, nó còn phải đảm nhận những công việc không ai muốn làm — chạy lại đánh giá khi nâng cấp, điều chỉnh lại prompts dựa trên các tình huống biên của khách hàng, triển khai mà không làm gián đoạn môi trường sản xuất. Phòng thí nghiệm không làm những việc này cho khách hàng; họ chỉ bán mô hình tiếp theo và bảo bạn tự chuyển đổi. Các công ty ở các nơi khác của đất Oz đã tiếp nhận các chi phí chuyển đổi này.

Tối ưu chi phí: Chạy mọi truy vấn bằng mô hình khổng lồ mới nhất là con đường nhanh nhất dẫn đến lỗ hổng lãi. Các công ty ứng dụng tốt nhất sẽ thực hiện phân luồng mô hình ở các cấp độ khác nhau — dùng mô hình tiên tiến cho các nhiệm vụ khó nhất, mô hình trung cấp cho phần lớn các nhiệm vụ thường xuyên, và dùng các mô hình nhỏ hơn, tùy chỉnh hoặc tinh chỉnh cho các phần đặc thù.

Phòng thí nghiệm định giá theo biên lợi nhuận: cung cấp các dịch vụ thông minh tối thiểu với giá X USD. Các công ty ở các nơi khác của đất Oz thì ngược lại — cung cấp mức độ thông minh phù hợp nhất với quy trình công việc thực tế, với chi phí thấp nhất bằng USD. Điều này chỉ khả thi khi bạn hiểu chính xác từng nhiệm vụ cần mức độ nào.

Quản trị (Governance): Trở thành bảng điều khiển kiểm soát (control plane) vận hành AI trong lĩnh vực dọc của khách hàng có giá trị cực lớn — đây là nơi quyền hạn, kiểm toán, những gì Agent được phép làm và những gì nó đã làm hội tụ.

Bởi vì họ sở hữu toàn bộ công cụ, quy trình làm việc và dữ liệu mà Agent tiếp cận, họ có thể cung cấp kết quả chính xác. Họ còn là thực thể tiếp nhận các quy định phức tạp cho người mua cuối — luật pháp, HIPAA trong y tế, SEC và FINRA trong tài chính, các quy định bảo hiểm của các bang, v.v. Giám đốc công nghệ (CIO) muốn có một đối tác có thể rõ ràng trong hợp đồng rằng "họ đang xử lý vấn đề tuân thủ cho Agent cung cấp".

Tất cả những điều này đều quy về một điểm chung: Tập trung. Có thể là một lĩnh vực dọc (bảo hiểm, pháp lý, kế toán), hoặc một chức năng chuyên sâu (bán hàng, hỗ trợ khách hàng, tài chính). Phòng thí nghiệm không sinh ra để làm điều này. Họ phải có mặt khắp nơi, phục vụ mọi người, và đó là lý do họ xây dựng lại đường gạch vàng mới nhất. Cùng với đó, những cân nhắc này cũng khiến họ bị đẩy ra khỏi các nơi khác của đất Oz — bạn không thể đồng thời có mặt khắp nơi và làm tốt một việc nào đó đến mức tối đa. Hai điều này không thể cùng lúc.

Trường hợp lĩnh vực bán hàng — lời khuyên thực tiễn từ CEO của 11x

Trong thực tế, bạn nên suy nghĩ thế nào về vấn đề này? Dưới đây là một số lời khuyên thực tiễn từ CEO của 11x, Prabhav Jain:

Tập trung vào kết quả

Chiến lược để xây dựng một công ty miễn nhiễm với phòng thí nghiệm là bắt đầu từ kết quả "cụ thể" mà khách hàng thực sự quan tâm. Đối với chúng tôi, đó là giúp các công ty xây dựng nhiều hơn các kênh bán hàng (pipeline).

Chúng tôi muốn có toàn bộ các hoạt động thực sự thúc đẩy pipeline? Phân tích từng hoạt động thành các nhiệm vụ. Nhiệm vụ nào cần Agent, nhiệm vụ nào không? Khi quy trình làm việc có nhiều bước, dữ liệu lộn xộn, trạng thái khó hiểu hoặc có các hạn chế thực tế, chỉ dựa vào mô hình tốt hơn là không đủ. Công việc này thuộc về kỹ sư phần mềm truyền thống.

Ví dụ, các nhiệm vụ chúng tôi xử lý gồm: phát triển khách hàng tiềm năng dựa trên tín hiệu tùy chỉnh, làm giàu dữ liệu, nghiên cứu sâu về tài khoản, lấy ngữ cảnh CRM, viết nội dung cho các kênh cụ thể, Agent kiểm tra tư cách khách hàng tiềm năng, hệ thống gửi email. Những nhiệm vụ này không thể hoàn thành trong một lần, đòi hỏi nền tảng kỹ thuật vững chắc. Khoảng một nửa quy trình thực tế là không dùng Agent, phần này hoàn toàn không có lợi thế từ phòng thí nghiệm.

Tăng cường ở các vấn đề phức tạp

Các vấn đề phức tạp mới là nơi thực sự có thể khai thác giá trị thương mại. Nếu không, bạn chỉ xây một lớp vỏ mỏng (thin wrapper).

Ví dụ trong lĩnh vực mở rộng thị trường (GTM): nếu một công ty đã là khách hàng của bạn, bạn không nên liên hệ trực tiếp với một người liên lạc trong công ty đó.

Nhưng thực tế không đơn giản vậy. Nếu là công ty có hàng chục công ty con? Nếu dữ liệu CRM chỉ ghi nhận tên miền của công ty mẹ? Nếu một trường hợp trùng lặp hết hạn khiến một email giới thiệu lạnh (cold pitch) gửi nhầm đến trưởng doanh thu (CRO) của khách hàng hiện tại? Để xử lý sự hỗn loạn này, cần một Agent đặc thù phù hợp với dạng vấn đề, chứ không phải một trợ lý chung chung (copilot).

Hàng rào không chỉ để ngăn chặn điều xấu, đó chính là lý do khách hàng trả tiền

Vai trò của hàng rào bị đánh giá thấp quá mức. Một khách hàng tiềm năng trong lĩnh vực tài chính có quy định nghiêm ngặt yêu cầu các biện pháp bảo vệ, khác hẳn một khách hàng SaaS trung bình, nơi các biện pháp này quy định Agent được phép viết gì, liên hệ với ai, truy cập dữ liệu nào, và cách ghi lại các quyết định.

Với các khác biệt này, hệ thống chung sẽ dễ bị phá vỡ. Hàng rào phải được xây dựng phù hợp với từng trường hợp sử dụng, cấu hình theo khách hàng, và liên tục kiểm tra, giám sát. Đó là lý do chúng tôi có các kỹ sư triển khai trực tiếp (FDE) và chiến lược gia triển khai công nghệ, họ cần điều chỉnh theo yêu cầu của từng khách hàng.

Trường hợp lĩnh vực bảo hiểm — lời khuyên thực tiễn từ CEO của FurtherAI

Bán hàng là một ví dụ. Bảo hiểm là một ví dụ khác, chứng minh cùng một quan điểm theo cách khác. Dưới đây là ý kiến của CEO FurtherAI, Aman Gour:

"Khi chúng tôi bắt đầu triển khai AI trong lĩnh vực bảo hiểm thực sự, chúng tôi luôn nghe một giả định đặc biệt: mô hình là trí tuệ, còn quy trình làm việc chỉ là khung xương xung quanh nó.

Càng hợp tác với nhiều công ty bảo hiểm, chúng tôi càng tin rằng giả định này đảo ngược nguyên nhân và kết quả. Trong ngành bảo hiểm, phần lớn trí tuệ thực sự nằm trong chính quy trình làm việc.

Hai công ty bảo hiểm có thể xử lý một đơn đăng ký bảo hiểm theo cùng một quy trình: nộp, thẩm định, báo giá, chấp thuận. Nhưng đó chỉ là phần đơn giản nhất. Điều phân biệt hai công ty là tất cả các chi tiết: những rủi ro cần báo cáo, các tín hiệu tổn thất quan trọng, khi nào các quy tắc về "tâm lý rủi ro" (appetite) mâu thuẫn, khi nào cần ký duyệt thủ công, và cách ghi lại quyết định cuối cùng. Những logic này không nằm trong một hệ thống quy tắc rõ ràng. Nó phân tán trong SOP, kiểm duyệt của quản lý, nguyên tắc đánh giá rủi ro, và kinh nghiệm vận hành nhiều năm.

Đó là lý do chúng tôi xây dựng quy trình làm việc có Agent (agentic workflows). Quy trình này có tính lặp lại rõ ràng, có thể kiểm tra, kiểm soát chi phí; Agent xử lý các biến thể, sửa chữa khi quy trình tiêu chuẩn thất bại; con người giữ vai trò trong quy trình (human-in-the-loop), chịu trách nhiệm các quyết định có tính trách nhiệm.

Theo thời gian, quy trình không còn chỉ là một đoạn script nữa, mà bắt đầu trở thành kho lưu trữ vận hành (operating memory) của công ty bảo hiểm. Đây là phần mà phòng thí nghiệm khó tiếp cận. Hiểu rõ điều này chỉ có thể đến từ việc vận hành quy trình đó hàng nghìn lần trong môi trường thực tế. Ngày đầu ra mắt quy trình không phải là hàng rào cạnh tranh, mà theo thời gian, vòng kín do vận hành tạo ra mới chính là lợi thế cạnh tranh."

Làm thế nào để bạn tự đánh giá mình có đang ở nơi khác của đất Oz không?

  • Kiểm tra công cụ và bước (The tools-and-steps test): Công việc này cần bao nhiêu bước? Bạn phải xây dựng bao nhiêu công cụ phức tạp để hỗ trợ? So sánh: một hệ thống tìm kiếm AI ngang qua Google Drive (công cụ đơn, bước đơn, độ lỗi cao); hay là chỉnh sửa điều khoản pháp lý qua nhiều bước, vượt qua các tiền lệ của luật sư ba năm, qua nhiều công cụ, kết quả phải qua phê duyệt của đối tác? Cả hai đều trông như "Agent đang làm việc", nhưng chỉ một trong số đó đòi hỏi đội ngũ phát triển phần mềm nhiều năm để xây dựng sâu.

  • Kiểm tra hệ thống (The system test): Bạn đang xây dựng một "hệ thống" để khách hàng vận hành công việc của họ, hay chỉ là một "công cụ" tích hợp vào hệ thống đã có của họ? Hệ thống là toàn bộ quy trình làm việc — thu thập dữ liệu, quản lý, ghi chép kết quả đã hoàn thành. Trong khi đó, công cụ chỉ là phần bổ sung trí tuệ cho quy trình đã vận hành của khách hàng. Chỉ số cao về giá trị hợp đồng hàng năm (ACV) thường là tín hiệu của hệ thống, vì nó thay thế nhân lực thực tế. Hỏi chính mình: nếu một phòng thí nghiệm ra mắt sản phẩm cạnh tranh trực tiếp, khách hàng có còn cần công cụ của bạn không? Nếu có, bạn đang xây dựng hệ thống.

  • Kiểm tra quỹ đầu tư / bảng lợi nhuận (The hedge fund / P&L test): Hiệu suất của phòng thí nghiệm dựa trên các chuẩn mực (benchmarks), còn hiệu suất của các nơi khác của đất Oz dựa trên bảng lợi nhuận (P&L) của khách hàng. Khách hàng của bạn không quan tâm mô hình của bạn đạt điểm cao thế nào trong các chuẩn mực — họ quan tâm mô hình có giúp giao dịch, chỉnh sửa hợp đồng chính xác hay không. Các doanh nghiệp Agent xuất sắc nhất cần vận hành như quỹ phòng hộ — chiến thắng trong "lợi nhuận vượt trội (Alpha)" đo bằng bảng lợi nhuận của khách hàng.

Cả hai đều có thể (và sẽ) chiến thắng

Chúng ta sẽ thấy các nhà thắng lớn trong và ngoài đường gạch vàng. Các công ty mô hình sẽ tiếp tục thắng vì họ sở hữu mô hình và kênh phân phối các công cụ chung.

Các công ty ở các nơi khác của đất Oz nếu có thể xây dựng hệ thống làm việc (system of work), tức là quy trình thực thi công việc thực tế của công ty và dữ liệu được thu thập từ đó, thì sẽ thắng — đặc biệt khi các quy trình phức tạp trong lĩnh vực dọc trưởng thành. Chúng có thể hợp thành trải nghiệm cốt lõi khách hàng dựa vào. Mô hình nền tảng có thể thay thế, nhưng hệ thống làm việc thì không.

Thế hệ phần mềm doanh nghiệp tiếp theo sẽ ra đời ngoài đường gạch vàng.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim