OpenRouter ra mắt Fusion API, giúp đạt hiệu suất của Fable 5 với một nửa chi phí, đồng thời Anthropic tạm dừng mô hình dựa trên OpenRouter, công ty này đã ra mắt Fusion vào ngày 12 tháng 6 — một API phía máy chủ có thể gửi đồng thời các gợi ý đến nhiều mô hình AI, sau đó sử dụng mô hình đánh giá và bộ hợp nhất để kết hợp kết quả thành một câu trả lời duy nhất. Trong bài kiểm tra tiêu chuẩn DRACO của Perplexity, một bảng ngân sách đã kết hợp Gemini 3 Flash với các mô hình mã nguồn mở Kimi K2.6 và DeepSeek V4 Pro, và được tổng hợp bởi Claude Opus 4.8, đạt hiệu suất 64,7% — thấp hơn Fable 5 chỉ khoảng 1%, chi phí giảm khoảng một nửa, và vượt trội hơn khi sử dụng riêng GPT-5.5 (60%) và Opus 4.8 (58,8%). Thời điểm này trùng với một lệnh kiểm soát xuất khẩu của Mỹ, buộc Anthropic tạm dừng Fable 5 và Mythos 5 cho công dân nước ngoài trên toàn cầu. OpenRouter định vị Fusion là “Thông minh cấp Fable, giá giảm một nửa” để bù đắp cho khoảng trống do lệnh tạm dừng gây ra.

Xem bản gốc
GateNews
OpenRouter ra mắt Fusion API, khớp hiệu năng Fable 5 với chi phí chỉ bằng một nửa khi Anthropic tạm dừng mô hình
Theo OpenRouter, công ty đã ra mắt Fusion vào ngày 12/6, một API phía máy chủ gửi prompt đến nhiều mô hình AI song song, sau đó dùng mô hình “judge” và bộ tổng hợp để gộp các kết quả thành một câu trả lời duy nhất. Trên benchmark DRACO của Perplexity, một bảng điều khiển ngân sách kết hợp Gemini 3 Flash với các mô hình mã nguồn mở Kimi K2.6 và DeepSeek V4 Pro, được Claude Opus 4.8 tổng hợp, đạt 64,7% hiệu năng—chỉ kém Fable 5 khoảng 1% với chi phí xấp xỉ một nửa và vượt trội so với GPT-5.5 chạy
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim