Phỏng vấn đồng sáng lập OpenAI Karpathy: LLM là máy tính mới, mọi thứ đều phải "viết lại"

robot
Đang tạo bản tóm tắt

原视频标题:Andrej Karpathy: Từ Lập trình Vibe đến Kỹ thuật Tác nhân

原视频来源:Sequoia Capital
原文编译:鲍奕龙,华尔街见闻

Người đồng sáng lập OpenAI Andrej Karpathy trong cuộc phỏng vấn mới nhất chỉ ra rằng, mô hình ngôn ngữ lớn đang đóng vai trò như “máy tính mới” toàn diện định hình lại kiến trúc tính toán.

Vào ngày 29 tháng 4, Andrej Karpathy, người từng dẫn dắt phát triển Autopilot của Tesla và có vị trí quan trọng tại OpenAI, đã phân tích sâu về sự tiến bộ công nghệ của AI đại diện và ảnh hưởng sâu rộng của nó đối với hệ sinh thái phần mềm và phần cứng trong một sự kiện do AI Sent tổ chức.

Karpathy cho biết, kể từ tháng 12 năm ngoái, ông bắt đầu nhận thức rằng quy trình làm việc dựa trên tác nhân đã thực sự khả dụng, sự chuyển đổi này đánh dấu sự thực của thời đại Software 3.0.

Ông nói: Nhiều người vẫn còn ấn tượng về AI vào năm ngoái là ChatGPT, nhưng bạn phải xem xét lại, đặc biệt là từ tháng 12 trở đi — mọi thứ đã thay đổi căn bản.

Ông cũng đề xuất khái niệm mới gọi là “kỹ thuật tác nhân” (agentic engineering), để phân biệt với “lập trình vibe” (vibe coding) mà ông đã đặt tên năm ngoái, trong đó, trước đây, đề cập đến việc duy trì và tăng tốc tiêu chuẩn chất lượng trong phát triển phần mềm chuyên nghiệp.

Ông thẳng thắn nói rằng, rất nhiều mã nguồn và ứng dụng hiện có “không nên tồn tại” trong mô hình mới này, và hầu hết các tổ chức hiện nay vẫn thiết kế quy trình tuyển dụng, công cụ phát triển và hạ tầng dựa trên con người chứ không phải tác nhân.

Bình minh của Software 3.0: Chuyển giao quyền lực của kiến trúc tính toán nền tảng

Ngành công nghệ đang đứng trước một ngã rẽ từ biến đổi lượng sang biến đổi chất.

Tháng 12 năm ngoái là một điểm ngoặt quan trọng, Karpathy thừa nhận, trước các mô hình AI mới nhất, ông đã trải qua một cú sốc sâu sắc:

Các đoạn mã do hệ thống tạo ra ngày càng hoàn hảo, tôi thậm chí không nhớ lần cuối cùng chỉnh sửa nó là khi nào. Tôi chỉ ngày càng tin tưởng hệ thống này… (Điều này khiến tôi) chưa từng cảm thấy mình còn tụt hậu như vậy trong vai trò lập trình viên.

Sự tác động này là sự thay đổi hoàn toàn về phương thức tính toán. Theo Karpathy, thị trường hiện đang đánh giá thấp độ sâu của sự thay đổi này.

Ông chỉ ra rằng, chúng ta đang nói lời tạm biệt với “phần mềm 1.0 (viết mã)” và “phần mềm 2.0 (tổ chức dữ liệu để huấn luyện mạng nơ-ron)”, chính thức bước vào thời đại “phần mềm 3.0”.

Trong kỷ nguyên mới này, mô hình ngôn ngữ lớn chính là một “máy tính mới”.

Ông nói: Bây giờ, lập trình của bạn trở thành việc viết các gợi ý, và nội dung trong cửa sổ ngữ cảnh chính là đòn bẩy để bạn điều khiển mô hình ngôn ngữ lớn như một trình thông dịch, để nó thực hiện các phép tính trong không gian thông tin số.

Điều khiến thị trường chú ý hơn nữa là dự đoán táo bạo của ông về sự tiến hóa của kiến trúc phần cứng nền tảng trong tương lai.

Hiện tại, mạng nơ-ron vẫn hoạt động dưới dạng ảo hóa trên máy tính hiện có, nhưng ông tin rằng trong tương lai, mối quan hệ chủ khách này sẽ đảo ngược: bạn có thể tưởng tượng, mạng nơ-ron sẽ trở thành tiến trình chính, còn CPU sẽ biến thành một loại bộ xử lý phụ trợ. Mạng nơ-ron sẽ đảm nhận phần lớn công việc nặng nhọc.

Điều này có nghĩa là, “tính toán thông minh” — chiến lược trung tâm của toàn bộ chi tiêu vốn thị trường — sẽ tiếp tục củng cố vị trí chiến lược của nó trong tương lai.

Cơ sở hạ tầng thế hệ tiếp theo: Tái cấu trúc hệ sinh thái “tác nhân nguyên bản” (agent-native)

Khi thực thi và mã hóa do máy móc tiếp quản, giá trị cốt lõi của con người và hình thái hạ tầng tương lai sẽ đi về đâu?

Karpathy thẳng thắn: Tất cả mọi thứ đều phải được viết lại.

Các tài liệu hướng dẫn về các khung và thư viện internet hiện tại vẫn là “viết cho con người”, điều này khiến ông cảm thấy vô cùng phiền lòng.

Karpathy phàn nàn: Tại sao còn phải nói cho tôi biết phải làm thế nào? Tôi không muốn làm gì cả. Tôi chỉ cần sao chép và dán văn bản nào đó cho AI tác nhân của mình?

Cơ hội lớn trong thị trường tương lai nằm ở việc xây dựng hạ tầng “ưu tiên tác nhân”.

Trong thế giới này, hệ thống được phân tách thành “cảm biến” để nhận thức thế giới và “thiết bị thực thi” để biến đổi thế giới, cấu trúc dữ liệu phải cho phép mô hình ngôn ngữ lớn đọc hiểu cao độ, và các tác nhân máy móc đại diện cho cá nhân và tổ chức để tương tác trên đám mây.

Trong một tương lai tự động hóa cao như vậy, sự khan hiếm cốt lõi của con người sẽ trở lại với khả năng thẩm mỹ, khả năng đánh giá và hiểu biết sâu sắc về kinh doanh.

Karpathy trích dẫn một câu nói khiến ông phải nghiền ngẫm nhiều lần để tổng kết: Bạn có thể thuê ngoài suy nghĩ của mình, nhưng bạn không thể thuê ngoài sự hiểu biết của mình.

Kỹ thuật tác nhân: Vượt xa “10 lần năng suất của kỹ sư” với bùng nổ năng lực

Trong lĩnh vực nâng cao năng suất, Karpathy phân biệt hai khái niệm cốt lõi: “lập trình vibe” (Vibe coding) và “kỹ thuật tác nhân” (Agentic engineering).

Ông chỉ ra rằng, “lập trình vibe” nâng cao giới hạn tối thiểu của việc phát triển phần mềm toàn diện, còn “kỹ thuật tác nhân” nhằm duy trì giới hạn tối đa về chất lượng phần mềm chuyên nghiệp.

“Kỹ thuật tác nhân” không chỉ đơn thuần là tăng tốc, mà còn yêu cầu các nhà phát triển phối hợp các “tác nhân AI có phần dễ sai sót, mang tính ngẫu nhiên nhưng cực kỳ mạnh mẽ”, để tiến về phía trước với tốc độ tối đa mà không làm giảm chất lượng.

Điều này cũng sẽ mở rộng đáng kể khả năng sáng tạo của doanh nghiệp.

Karpathy nhấn mạnh: “Người ta thường nói về kỹ sư gấp 10 lần”, nhưng 10 lần đã không còn đủ để mô tả tốc độ tăng trưởng bạn đạt được nữa. Theo tôi, những người xuất sắc trong lĩnh vực này có thể đạt hiệu suất vượt xa 10 lần.

Đối mặt với sự bùng nổ năng suất này, cấu trúc tổ chức và logic tuyển dụng nhân tài của các doanh nghiệp cần phải được tái cấu trúc.

Ông đề xuất các doanh nghiệp từ bỏ các phương pháp phỏng vấn dựa trên thuật toán truyền thống, chuyển sang đánh giá cách ứng viên sử dụng nhiều tác nhân AI để hợp tác xây dựng các dự án lớn và khả năng chống lại các cuộc tấn công từ các tác nhân AI khác.

Điểm nhấn trong ứng dụng thương mại AI

Đối với các nhà sáng lập và nhà đầu tư đang khẩn trương tìm kiếm các kịch bản ứng dụng AI, Karpathy cung cấp một khung đánh giá thực tiễn: khả năng xác minh.

Hiện tại, khả năng của AI thể hiện qua một dạng “gợn sóng” cực kỳ kỳ quặc.

Ô ví dụ: Các mô hình tiên tiến nhất ngày nay có thể đồng thời tái cấu trúc 100.000 dòng mã hoặc tìm lỗ hổng zero-day, nhưng lại bảo tôi đi bộ 50 mét đến tiệm rửa xe để rửa xe, điều này thật điên rồ.

Nguyên nhân của sự chia rẽ này là do các phòng thí nghiệm tiên phong (như OpenAI) đã đổ lượng lớn tài nguyên học tăng cường vào các lĩnh vực dễ xác minh kết quả như “toán học” và “mã nguồn”.

Vì vậy, chỉ cần đặt trong các bối cảnh kinh doanh có thể xác minh kết quả, AI có thể phát huy sức mạnh to lớn.

Karpathy gợi ý rằng, vẫn còn rất nhiều môi trường học tăng cường có giá trị cao nhưng chưa được các phòng thí nghiệm hàng đầu chú ý, chính là những vùng đất màu mỡ để các công ty khởi nghiệp tinh chỉnh (fine-tuning) và thương mại hóa.

原视频链接

Nhấn để xem các vị trí tuyển dụng của BlockBeats theo nhịp điệu

Chào mừng gia nhập cộng đồng chính thức của BlockBeats:

Nhóm theo dõi trên Telegram: https://t.me/theblockbeats

Nhóm trao đổi trên Telegram: https://t.me/BlockBeats_App

Tài khoản chính thức trên Twitter: https://twitter.com/BlockBeatsAsia

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim