Kỹ sư của OpenAI nói rằng công cụ trung gian nội bộ là dự án thú vị nhất trong sự nghiệp của anh ấy

robot
Đang tạo bản tóm tắt

Tiêu đề

Kỹ sư OpenAI nói rằng công cụ đại lý nội bộ là dự án thú vị nhất trong sự nghiệp của anh

Tóm tắt

Jason Liu là kỹ sư ML cấp cao tại OpenAI, trước đây đã làm việc tại Stitch Fix và Meta. Gần đây, anh đã đăng bài nói rằng mình “vui hơn bất kỳ ai ở phòng thí nghiệm AI nào”. Nguyên nhân là anh đã có tiến bộ mới với công cụ đại lý Codex nội bộ tại OpenAI: plugin vừa mới ra mắt, khả năng sử dụng đạt 99%. Anh đã kết nối 58 tự động hóa và 30 plugin cho quy trình làm việc của mình.

  • Điều này cho thấy hệ thống đại lý nội bộ đã từ giai đoạn nguyên mẫu chuyển sang có thể sử dụng thực tế, có ý nghĩa thực sự đối với tự động hóa doanh nghiệp và triển khai sản xuất.

Phân tích

Liu đã viết thư viện Instructor, OpenAI đã công khai cảm ơn thư viện này, nói rằng nó đã truyền cảm hứng cho cách làm “đầu ra LLM có cấu trúc”. Trước khi gia nhập OpenAI, anh đã tư vấn cho các công ty như Zapier, HubSpot. Bối cảnh chú trọng vào ứng dụng thực tế này khiến phán đoán của anh trở nên đáng tin cậy hơn.

Anh nói rằng hệ thống hiện đã đạt 99% khả năng sử dụng, tự động hóa đã bao phủ hầu hết công việc ngoại trừ “nghĩ ra ý tưởng và nói chuyện với mọi người”. Điều này có nghĩa là OpenAI đã có tiến bộ thực sự trong việc xây dựng hệ thống đại lý đáng tin cậy và có thể mở rộng. Anh cá nhân nghiêng về hướng hiệu quả của đại lý đơn thay vì kiến trúc đại lý đa.

So sánh hai hướng đi:

Kích thước Đại lý đơn (Lựa chọn của Liu) Đại lý đa (Thí nghiệm)
Mục tiêu Hiệu suất đầu cuối, vận hành đơn giản Phân công hợp tác, giải quyết nhiệm vụ phức tạp
Rủi ro Ít thành phần, dễ kiểm tra khi gặp sự cố Phối hợp phức tạp, sự cố dễ lây lan
Tình trạng hiện tại Đã đạt 99% khả năng sử dụng Vẫn đang tìm cách sắp xếp tốt nhất
  • Góc độ cạnh tranh: Nếu công cụ nội bộ của OpenAI gần đạt khả năng sản xuất, những khả năng này rất có thể sẽ dần được mở ra cho API công cộng và công cụ dành cho nhà phát triển.
  • Góc độ nhân tài: Việc cho phép kỹ sư “chơi vui” trong công việc thực tế đã là một sức hấp dẫn, giúp tăng tốc độ lặp lại.

Đánh giá tác động

  • Tầm quan trọng: Cao
  • Loại: Thông tin công nghệ, công cụ cho nhà phát triển, nghiên cứu AI

Kết luận: Vấn đề này vẫn đang ở giai đoạn đầu, nhưng đã thấy dấu hiệu khả năng sản xuất. Những người đầu tiên được lợi sẽ là các nhà phát triển sản phẩm và các đội ngũ doanh nghiệp. Đối với các nhà đầu tư giao dịch, hiện tại không có tín hiệu khả thi nào, nhưng các quỹ dài hạn có thể theo dõi khi nào khả năng nội bộ được mở ra cho sản phẩm công cộng và API.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Gate Fun hot

    Xem thêm
  • Vốn hóa:$2.27KNgười nắm giữ:2
    0.00%
  • Vốn hóa:$2.37KNgười nắm giữ:2
    1.04%
  • Vốn hóa:$2.24KNgười nắm giữ:1
    0.00%
  • Vốn hóa:$2.24KNgười nắm giữ:1
    0.00%
  • Vốn hóa:$2.25KNgười nắm giữ:1
    0.00%
  • Ghim