Google lần này đã nhét mô hình lớn vào bộ nhớ 1GB, chạy AI trên điện thoại cuối cùng không còn lag nữa, các nhà phát triển vui mừng

Xem bản gốc
CoinNetwork
Thông báo từ CoinWorld, Google đã phát hành mô hình Gemma 4 siêu nhẹ, bộ nhớ chạy cục bộ trên điện thoại lần đầu tiên giảm xuống dưới 1GB.
Mô hình này sử dụng công nghệ nén lượng tử, giảm độ chính xác của các giá trị để thu nhỏ kích thước mô hình, đồng thời duy trì mức độ trí tuệ cao.
Google cũng đã tối ưu hóa cho chip di động, đảm bảo hoạt động mượt mà.
Trọng số của mô hình mới đã được mở nguồn trên Hugging Face, người dùng cá nhân có thể tải xuống và chạy qua Ollama và LM Studio, các nhà phát triển trên di động và web cũng có thể triển khai nhanh chóng qua các engine hỗ trợ.
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim