Cựu nhà nghiên cứu OpenAI ra mắt Context Engine: agent sau khi gắn nhớ, suy luận thấp hơn so với suy luận trung bình

robot
Đang tạo bản tóm tắt
Tin tức từ CoinWorld, cựu nhà nghiên cứu của OpenAI đã thành lập Applied Compute đã phát hành Context Engine, đây là một bộ máy ngữ cảnh cho các agent doanh nghiệp. Bộ máy này sẽ tổng hợp các tài liệu nội bộ, lịch sử phiếu công việc và hành trình hoạt động của agent thành một kho kiến thức gọi là contextbase, giúp agent truy xuất trực tiếp khi thực hiện nhiệm vụ, giảm thiểu ngân sách suy luận. Trên apex-agents (được Mercor phát triển để đánh giá các chuyên ngành đầu tư ngân hàng, tư vấn, pháp lý), mức suy luận thấp của GPT-5.4 đã tăng từ 44.5% lên 52.4%, gần bằng mức 52.3% của mức suy luận không có bộ nhớ. Mức suy luận thấp tăng 7.9%, mức suy luận trung bình tăng 3.7%, còn mức suy luận cực cao lại giảm 0.7%. Trên mức chuẩn trung bình, apex-agents của GPT-5.4 đã tăng từ 44.2% lên 51.7%, tương đương tăng 16.9%. GPT-5.4-mini từ 33.4% lên 38.7%, tương đương tăng 15.8%. Applied Compute cho rằng, do ít cấu trúc có thể tái sử dụng giữa các nhiệm vụ, nên điểm chuẩn đã gần đạt đỉnh.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim