Phỏng vấn đồng sáng lập OpenAI Karpathy: LLM là máy tính mới, mọi thứ đều phải được "viết lại"

robot
Đang tạo bản tóm tắt

Tiêu đề gốc: Phỏng vấn đồng sáng lập OpenAI Karpathy: LLM là máy tính mới, mọi thứ đều phải “viết lại”

Tác giả gốc: BlockBeats

Nguồn gốc gốc:

Chuyển thể: Mars Finance

Đồng sáng lập OpenAI Andrej Karpathy trong cuộc phỏng vấn mới nhất chỉ ra rằng, mô hình ngôn ngữ lớn đang được xem như “máy tính mới” đang toàn diện định hình lại kiến trúc tính toán.

Vào ngày 29 tháng 4, Andrej Karpathy, người từng dẫn đầu phát triển Autopilot của Tesla và giữ vị trí quan trọng trong OpenAI, đã có một phân tích sâu về sự tiến bộ công nghệ của AI hiện tại và ảnh hưởng sâu rộng của nó đối với hệ sinh thái phần mềm và phần cứng trong một sự kiện do AI Sent tổ chức.

Karpathy cho biết, kể từ tháng 12 năm ngoái, ông bắt đầu nhận thức rằng quy trình làm việc dựa trên đại lý đã thực sự khả dụng, sự chuyển đổi này đánh dấu sự chính thức của thời đại Software 3.0.

Ông nói: Nhiều người vẫn còn ấn tượng về AI vào năm ngoái là ChatGPT, nhưng bạn phải xem xét lại, đặc biệt là từ tháng 12 trở đi — mọi thứ đã thay đổi căn bản.

Ông cũng đề xuất khái niệm mới gọi là “kỹ thuật đại lý” (agentic engineering), để phân biệt với “lập trình vibe” (vibe coding) mà ông đặt tên năm ngoái, trong đó, trước đây, đề cập đến việc duy trì và tăng tốc tiêu chuẩn chất lượng trong phát triển phần mềm chuyên nghiệp.

Ông thẳng thắn nói rằng, rất nhiều mã nguồn và ứng dụng hiện có “không nên tồn tại” trong mô hình mới này, và phần lớn quy trình tuyển dụng, công cụ phát triển và hạ tầng hiện tại vẫn đang được thiết kế cho con người chứ không phải cho đại lý.

Ánh sáng của Software 3.0: Chuyển giao quyền lực của kiến trúc tính toán nền tảng

Ngành công nghiệp công nghệ đang đứng trước một ngã rẽ từ biến đổi lượng sang biến đổi chất.

Tháng 12 năm ngoái là một điểm mốc quan trọng, Karpathy thừa nhận, trước các mô hình AI mới nhất, ông đã trải qua một cú sốc sâu sắc:

Các đoạn mã do hệ thống tạo ra ngày càng hoàn hảo, tôi thậm chí không nhớ lần cuối cùng chỉnh sửa nó là khi nào. Tôi chỉ ngày càng tin tưởng vào hệ thống này… (Điều này khiến tôi) chưa từng cảm thấy mình còn tụt hậu như vậy trong vai trò lập trình viên.

Sự va đập này là sự thay đổi hoàn toàn về mô hình tính toán. Theo Karpathy, thị trường hiện đang đánh giá thấp độ sâu của sự thay đổi này.

Ông chỉ ra rằng, chúng ta đang nói lời tạm biệt với “phần mềm 1.0 (viết mã)” và “phần mềm 2.0 (tổ chức dữ liệu để huấn luyện mạng neural)”, chính thức bước vào thời đại “phần mềm 3.0”.

Trong kỷ nguyên mới này, mô hình ngôn ngữ lớn chính là một “máy tính mới”.

Ông nói: Bây giờ, lập trình của bạn trở thành việc viết các gợi ý, còn nội dung trong cửa sổ ngữ cảnh chính là đòn bẩy để bạn điều khiển mô hình ngôn ngữ lớn như một trình giải thích, để nó thực hiện các phép tính trong không gian thông tin số.

Điều khiến thị trường chú ý hơn nữa là dự đoán táo bạo của ông về sự tiến hóa của kiến trúc phần cứng nền tảng trong tương lai.

Hiện tại, mạng neural vẫn chạy dưới dạng ảo hóa trên các máy tính hiện có, nhưng ông cho rằng, trong tương lai, mối quan hệ chủ khách này sẽ đảo ngược: bạn có thể tưởng tượng, mạng neural sẽ trở thành tiến trình chính, còn CPU sẽ biến thành một loại bộ xử lý phụ trợ. Mạng neural sẽ đảm nhận phần lớn công việc nặng nhọc.

Điều này có nghĩa là, “tính toán thông minh” — chiến lược cốt lõi của toàn bộ chi tiêu vốn thị trường — sẽ tiếp tục được củng cố trong tương lai.

Cơ sở hạ tầng thế hệ tiếp theo: Tái cấu trúc hệ sinh thái “đại lý nguyên sinh”

Khi việc thực thi và mã hóa được máy móc tiếp quản, giá trị cốt lõi của con người và hình thái hạ tầng tương lai sẽ đi về đâu?

Karpathy thẳng thắn: Mọi thứ đều phải được viết lại.

Các tài liệu hướng dẫn về các khung và thư viện internet hiện tại vẫn là “viết cho con người”, điều này khiến ông cảm thấy vô cùng phiền lòng.

Karpathy phàn nàn: Tại sao còn phải bảo tôi làm thế nào? Tôi chẳng muốn làm gì cả. Tôi nên sao chép dán đoạn văn bản nào cho đại lý AI của mình?

Cơ hội lớn trong tương lai nằm ở việc xây dựng hạ tầng “ưu tiên đại lý”.

Trong thế giới này, hệ thống được phân tách thành các “cảm biến” để cảm nhận thế giới và các “thiết bị thực thi” để biến đổi thế giới, cấu trúc dữ liệu phải dễ đọc cho mô hình ngôn ngữ lớn, các đại lý máy móc đại diện cho cá nhân và tổ chức để tương tác trên đám mây.

Trong một tương lai tự động hóa cao như vậy, giá trị cốt lõi của con người sẽ trở lại với thẩm mỹ, khả năng đánh giá và hiểu biết sâu sắc về kinh doanh.

Karpathy trích dẫn một câu nói khiến ông phải nghiền ngẫm đi nghiền ngẫm lại để tổng kết: Bạn có thể thuê ngoài suy nghĩ của mình, nhưng bạn không thể thuê ngoài sự hiểu biết của mình.

Kỹ thuật đại lý: Vượt xa “tăng gấp 10 lần năng suất kỹ sư”

Trong lĩnh vực nâng cao năng suất, yếu tố thị trường quan tâm nhất, Karpathy phân biệt hai khái niệm cốt lõi: “lập trình vibe” và “kỹ thuật đại lý”.

Ông chỉ ra rằng, “lập trình vibe” nâng cao giới hạn dưới của việc phát triển phần mềm toàn diện, còn “kỹ thuật đại lý” nhằm duy trì giới hạn trên về chất lượng phần mềm chuyên nghiệp.

“Kỹ thuật đại lý” không chỉ đơn thuần là tăng tốc, nó yêu cầu các nhà phát triển phối hợp các đại lý AI “có phần dễ sai sót, mang tính ngẫu nhiên nhưng cực kỳ mạnh mẽ”, để tiến về phía trước với tốc độ tối đa mà không làm giảm chất lượng.

Điều này cũng sẽ mở rộng đáng kể khả năng tưởng tượng về sản phẩm của doanh nghiệp.

Karpathy chỉ ra: “Người ta trước đây thường nói về kỹ thuật tăng gấp 10 lần năng suất kỹ sư”, nhưng 10 lần đã không còn đủ để mô tả tốc độ tăng trưởng bạn đạt được nữa. Theo tôi, những người xuất sắc trong lĩnh vực này, sản lượng tối đa của họ còn vượt xa 10 lần.

Đối mặt với sự bùng nổ năng suất này, cấu trúc tổ chức và logic tuyển dụng nhân tài của doanh nghiệp phải được tái cấu trúc.

Ông đề xuất các doanh nghiệp từ bỏ các phương pháp phỏng vấn dựa trên thuật toán truyền thống, chuyển sang đánh giá cách ứng viên phối hợp nhiều đại lý AI để xây dựng các dự án lớn, và có khả năng chống lại các cuộc tấn công từ các đại lý AI khác.

Điểm then chốt thúc đẩy thương mại AI

Đối với các nhà sáng lập và nhà đầu tư đang khẩn trương tìm kiếm các kịch bản ứng dụng AI, Karpathy cung cấp một khung đánh giá cực kỳ thực tế: khả năng xác minh.

Hiện tại, khả năng của AI thể hiện một dạng “gợn sóng” cực kỳ kỳ quặc.

Ông ví dụ: Mô hình tiên tiến nhất ngày nay có thể đồng thời tái cấu trúc 100.000 dòng mã hoặc tìm lỗ hổng zero-day, nhưng lại bảo tôi đi rửa xe ở tiệm rửa xe cách đó 50 mét, điều này thật điên rồ.

Nguyên nhân của sự chia rẽ này là các phòng thí nghiệm tiên phong (như OpenAI) đã đổ nguồn lực lớn vào các lĩnh vực dễ xác minh kết quả như “toán học” và “mã nguồn”.

Vì vậy, chỉ cần đặt trong các bối cảnh kinh doanh có thể xác minh kết quả, AI có thể phát huy sức mạnh to lớn.

Karpathy ngụ ý rằng, vẫn còn rất nhiều môi trường học tăng cường có thể xác minh cao, giá trị cao nhưng chưa được các phòng thí nghiệm hàng đầu chú trọng, chính là một thị trường ngách lớn để các công ty khởi nghiệp tinh chỉnh (fine-tuning) và thương mại hóa.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim