Microsoft cuối cùng cũng tham gia cuộc chơi với trí tuệ nhân tạo 7B, Fara-7B trực tiếp xem hình ảnh, thao tác trình duyệt, MIT mở mã nguồn thật thú vị

Xem bản gốc
MeNews
Microsoft phát hành mô hình trí tuệ nhân tạo điều khiển máy tính đầu tiên với 7 tỷ tham số Fara-7B
AIMPACT Tin nhắn, ngày 16 tháng 5 (UTC+8), Microsoft ra mắt Fara-7B, đây là mô hình trí tuệ nhân tạo nhỏ với 7 tỷ tham số đầu tiên được thiết kế đặc biệt cho các kịch bản sử dụng máy tính. Mô hình này sử dụng kiến trúc bộ giải mã đa mô hình, có thể nhận diện hình ảnh chụp màn hình và ngữ cảnh văn bản, dự đoán trực tiếp chuỗi suy nghĩ có tham số và hành động thao tác. Được xây dựng dựa trên Qwen 2.5-VL (7B), hỗ trợ độ dài ngữ cảnh 128k, được huấn luyện trong 2.5 ngày trên 64 GPU H100, phát hành theo giấy phép MIT vào ngày 24 tháng 11 năm 2025. Fara-7B nhận thức được đầu vào trình duyệt qua ảnh chụp màn hình, kết hợp suy luận nội bộ và ghi lại trạng thái lịch sử để dự đoán bước tiếp theo và các tham số (như tọa độ nhấp chuột), quá trình huấn luyện dựa trên bộ dữ liệu tổng hợp quy mô lớn. Mô hình có khả năng lập kế hoạch và thực hiện các nhiệm vụ cao cấp (như đặt bàn ăn, xin việc, lập kế hoạch
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim