Andrej Karpathy mới đây đã chia sẻ quan điểm về Agent bên trong, chỉ ra trực tiếp một sai lầm lớn nhất trong lĩnh vực AI hiện nay: mọi người đang ép buộc Agent phải làm việc, hoàn toàn bỏ qua việc trước tiên phải nắm vững hoàn toàn mô hình nền tảng. AK đã đưa ra một kết luận trái ngược với thông thường: hiện tại, những người đứng đầu trong lĩnh vực Agent không phải là các ông lớn mà là các nhà phát triển độc lập và doanh nhân khởi nghiệp. Video tôi đã đính kèm ở cuối bài viết.

Ngay từ năm 2016, OpenAI đã vấp phải cái bẫy này và phải trả giá bằng cả năm năm trời.

Logic cốt lõi mà Karpathy muốn truyền đạt: Bước đầu tiên, hãy ngay lập tức ngừng ảo tưởng về việc để tác nhân thông minh làm tất cả mọi thứ, trước hết hãy hiểu rõ mô hình nền tảng. Bước thứ hai, hãy nhận thức thực tế ngành, việc tạo ra bản demo cực kỳ đơn giản, nhưng để tạo ra sản phẩm thì cần mười năm. Lái xe tự động đã chứng minh điều này, nếu bỏ qua giai đoạn nền móng, tất cả những gì xây dựng lên sẽ sụp đổ ngay lập tức. Bước thứ ba, hãy hiểu rằng bản thân tác nhân thông minh thậm chí không được coi là một sản phẩm, mô hình cơ bản mới là cốt lõi thực sự. Chỉ cần xây dựng nền tảng tốt, các tác nhân thông minh sẽ tự nhiên xuất hiện.

Nhìn lại trải nghiệm tại OpenAI năm 2016, Karpathy cùng Tim Shi và Jim Fan đã cùng tham gia một dự án tên là World Bit. Ý định ban đầu của họ là để các tác nhân học tăng cường thoát khỏi các bài kiểm tra như chơi game, không còn chơi Montezuma's Revenge nữa, mà thử sử dụng máy tính, bàn phím và chuột.

Họ hy vọng các tác nhân thông minh có thể thực hiện một số công việc hàng ngày thực sự hữu ích, chẳng hạn như đặt vé máy bay hoặc gọi đồ ăn trên các trang web cực kỳ đơn giản. Lúc đó, họ đã để AI nhấp chuột và bấm phím điên cuồng, cố gắng tìm cách đột nhập vào một thế giới thông minh cao cấp hơn. Kết quả rõ ràng, dự án này đã thất bại hoàn toàn.

Công nghệ lúc đó hoàn toàn không đủ điều kiện, trong tay đội ngũ chỉ có mỗi cây búa là học tăng cường. Điều đúng đắn nhất vào thời điểm đó là hoàn toàn quên đi AI Agent, tập trung toàn bộ năng lượng vào việc xây dựng các mô hình ngôn ngữ.

Năm năm sau, sau khi tham gia lĩnh vực lái xe tự động trong một thời gian ngắn, Karpathy phát hiện ra rằng AI Agent một lần nữa trở thành chủ đề nóng hổi nhất trong ngành, nhưng toàn bộ chuỗi công cụ đã thay đổi hoàn toàn. Ngày nay, cách mọi người giải quyết những vấn đề này đã được tái cấu trúc hoàn toàn, những người phát triển Agent có khả năng cao là không cần sử dụng bất kỳ kỹ thuật học tăng cường nào. Sự phát triển này đã vượt quá dự đoán của tất cả mọi người lúc bấy giờ.

Hiện tại, tất cả mọi người đều cuồng nhiệt theo đuổi Agent, bởi vì mọi người dễ dàng liên tưởng đến việc trí tuệ nhân tạo tổng hợp cuối cùng chắc chắn sẽ xuất hiện dưới dạng một loại AI Agent nào đó. Trong tương lai, rất có thể sẽ xuất hiện hàng loạt Agent, thậm chí hình thành các tổ chức hoặc nền văn minh thực thể số khổng lồ. Điều này nghe có vẻ thực sự phấn khích.

Trước sự cuồng nhiệt này, Karpathy chọn cách dội một gáo nước lạnh. Có một loại vấn đề rất dễ để phát huy trí tưởng tượng và cũng rất dễ để tạo ra các bản demo ấn tượng, nhưng việc biến chúng thành sản phẩm thực sự lại vô cùng khó khăn.

Lái xe tự động là một ví dụ cực kỳ điển hình. Tưởng tượng một chiếc xe tự động chạy quanh khu phố và tạo ra bản demo rất dễ dàng, nhưng để biến nó thành sản phẩm thực sự cần mười năm. Lĩnh vực VR cũng vậy. Agent cũng hoàn toàn phù hợp với đặc điểm này, tưởng tượng và làm bản demo rất dễ, nhưng để nó thực sự hoạt động, các nhà phát triển phải chuẩn bị tinh thần cày cuốc suốt mười năm.

Để tìm kiếm hướng đi mới, Karpathy khuyên mọi người nên một lần nữa lấy cảm hứng từ khoa học thần kinh. Học sâu giai đoạn đầu đã làm như vậy, bây giờ phát triển Agent hoàn toàn có thể tham khảo lại cách hoạt động của bộ não.

Một thực thể số hoàn chỉnh cần sở hữu tất cả các công cụ nhận thức mà con người có. Ngoài mô hình ngôn ngữ như một phần của giải pháp, còn cần một trợ lý nội bộ để lập kế hoạch trước và phản ánh hành vi.

Cấu trúc não bộ cung cấp một bản thiết kế tham khảo hoàn hảo. Vùng đồi thị trong AI Agent tương đương với việc ghi lại dấu vết trí nhớ, sử dụng công nghệ nhúng vector để lập chỉ mục và truy xuất. Vỏ não thị giác và thính giác của thực thể số, chúng ta có lẽ biết cách xây dựng, vai trò của đồi thị cũng đáng để suy ngẫm. Đồi thị chịu trách nhiệm tích hợp tất cả thông tin, có thể nói là nơi ở của ý thức. Khi nhiều thực thể số tranh giành quyền kiểm soát và micro để quyết định bước tiếp theo, đồi thị chịu trách nhiệm xử lý xung đột phức tạp này. Karpathy cũng đặc biệt giới thiệu cuốn sách "The Brain and Behavior" của David Eagleman, cho rằng trong khoa học thần kinh chứa đựng nguồn cảm hứng tuyệt vời để thiết kế các cá thể số.

Cuối cùng, Karpathy chia sẻ một thực trạng ngành công nghiệp cực kỳ đột phá.

Hiện tại, những người đứng đầu về khả năng AI Agent, không nghi ngờ gì, chính là các nhà phát triển độc lập và doanh nhân khởi nghiệp đang xây dựng Agent. Các phòng thí nghiệm mô hình ngôn ngữ lớn như OpenAI hay DeepMind, hiện tại không đứng ở vị trí tiên phong trên đường đua Agent.

OpenAI rất giỏi trong việc huấn luyện các mô hình Transformer khổng lồ. Nếu bây giờ có một bài báo đề xuất phương pháp huấn luyện Transformer mới được xuất bản, thì khả năng cao là bên trong OpenAI đã thử nghiệm nó từ hai năm rưỡi trước, và biết rõ nguyên nhân thành công hay thất bại. Các ông lớn có rào cản kỹ thuật tuyệt đối trong lĩnh vực này.

Khi một bài báo về Agent mới được xuất bản, tình hình hoàn toàn khác. Đội ngũ của các ông lớn cũng sẽ cảm thấy sáng mắt, bởi vì họ đã không bí mật nghiên cứu năm năm trong nhánh cụ thể này. Điều này có nghĩa là các gã khổng lồ phải cạnh tranh sòng phẳng với tất cả các doanh nhân khởi nghiệp cấp cơ sở và hacker trên đường đua này.

Đối với các nhà phát triển bình thường hiện đang phát triển Agent, các bạn đang ở vị trí tiên phong của công nghệ mang tính cách mạng này.

Nguồn bài viết: AI寒武纪

Tuyên bố rủi ro và điều khoản miễn trừ trách nhiệm

          Thị trường có rủi ro, đầu tư cần thận trọng. Bài viết này không cấu thành khuyến nghị đầu tư cá nhân, và cũng không xem xét đến các mục tiêu đầu tư, tình hình tài chính hoặc nhu cầu đặc biệt của từng người dùng. Người dùng nên xem xét liệu bất kỳ ý kiến, quan điểm hoặc kết luận nào trong bài viết này có phù hợp với hoàn cảnh cụ thể của họ hay không. Đầu tư dựa trên điều này, tự chịu trách nhiệm.

Xem bản gốc

Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.

Phần thưởng
Thích
Bình luận
Đăng lại
Retweed

Bình luận

Thêm một bình luận

Không có bình luận

Chủ đề thịnh hành
Xem thêm
#
gStocksTokenizedStocksLive
4,82M Phổ biến
#
StrongNonfarmPayrollsRekindleRateHikeFear
1,07M Phổ biến
#
IsraelStrikesIranBTCPlunges
68,83K Phổ biến
#
PredictWorldCupShare20000U
235,96K Phổ biến
#
ETHBreaks1700
152,64M Phổ biến

Đã ghim

sơ đồ trang web

Quan điểm mới nhất của Karpathy về Agent: Các công ty lớn chưa nắm giữ công nghệ cốt lõi của tác nhân thông minh, các nhà phát triển cá nhân đang thống trị tiên phong.

Chủ đề thịnh hành

gStocksTokenizedStocksLive

StrongNonfarmPayrollsRekindleRateHikeFear

IsraelStrikesIranBTCPlunges

PredictWorldCupShare20000U

ETHBreaks1700

Đã ghim