Google Gemma 4 chính thức ra mắt: 4 kích thước lần đầu tiên theo giấy phép Apache 2.0, 31B là dự án mã nguồn mở toàn cầu thứ ba

BlockBeatNews · 2026-04-03T00:36:41+00:00

Google phát hành gia đình mô hình mã nguồn mở Gemma 4, gồm bốn kích thước, hỗ trợ thương mại và chỉnh sửa. Mô hình phù hợp với các kịch bản phần cứng khác nhau, có khả năng suy luận nhiều bước, sinh mã và các khả năng khác, trong ngày đầu đã hỗ trợ nhiều framework, đã tải xuống hơn 400 triệu lần, cho thấy ảnh hưởng rộng lớn của cộng đồng.

BlockBeatNews

2026-04-03 00:36:41

Đang tạo bản tóm tắt

Theo thông tin theo dõi của 1M AI News, Google chính thức phát hành gia đình mô hình mã nguồn mở Gemma 4, bao gồm 4 phiên bản với kích thước khác nhau, tất cả đều sử dụng giấy phép Apache 2.0. Google cho biết đây là phản hồi trước những ý kiến đóng góp từ cộng đồng. Apache 2.0 có nghĩa là nhà phát triển có thể tự do sử dụng cho mục đích thương mại, sửa đổi và phân phối, không bị ràng buộc thêm. Đồng sáng lập kiêm CEO của Hugging Face Clément Delangue gọi động thái này là “mốc son vĩ đại”.

4 mô hình nhắm đến các bối cảnh phần cứng khác nhau:

31B Dense: chất lượng gốc cao nhất, phù hợp cho tinh chỉnh; trọng số chưa lượng tử có thể chạy trên một GPU đơn 80GB H100, phiên bản lượng tử hỗ trợ GPU tầm trung cấp phổ thông
26B MoE (Hỗn hợp chuyên gia): tổng tham số 26B nhưng khi suy luận chỉ kích hoạt 3.8B, tập trung vào độ trễ thấp, phù hợp cho các tác vụ Agent nhạy cảm với tốc độ
E4B và E2B: mô hình biên cho thiết bị di động và IoT; khi suy luận lần lượt kích hoạt khoảng 4B và 2B tham số là đủ để duy trì thời lượng pin thiết bị, hỗ trợ gốc đầu vào âm thanh (nhận dạng và hiểu giọng nói), có thể chạy hoàn toàn offline

Trên bảng xếp hạng văn bản của nền tảng đánh giá ẩn danh đối đầu với mô hình lớn Arena AI, 31B đứng thứ ba trong số các mô hình mã nguồn mở trên toàn cầu, 26B đứng thứ sáu; Google cho biết đó là “mô hình vượt qua quy mô 20 lần”. Mô hình được xây dựng dựa trên cùng nghiên cứu và công nghệ với Gemini 3.

Năng lực cốt lõi bao gồm suy luận và lập kế hoạch nhiều bước, gọi hàm gốc và đầu ra JSON được cấu trúc (hướng đến quy trình làm việc của Agent), tạo sinh mã, hiểu biết về hình ảnh và video (toàn bộ dải), và huấn luyện gốc trên hơn 140 ngôn ngữ. Các mô hình biên hỗ trợ cửa sổ ngữ cảnh 128K, trong khi các mô hình lớn hỗ trợ tối đa 256K. E2B và E4B được tối ưu hóa chung với đội ngũ Pixel của Google, Qualcomm và MediaTek, có thể chạy trên các thiết bị như điện thoại, Raspberry Pi, NVIDIA Jetson Orin Nano; nhà phát triển Android có thể xây dựng ứng dụng Agent thông qua nguyên mẫu AICore Developer Preview để chuẩn bị tính tương thích cho Gemini Nano 4 tiếp theo.

Về hệ sinh thái, ngay trong ngày đầu đã hỗ trợ các khung công cụ phổ biến như Hugging Face, vLLM, llama.cpp, MLX, Ollama, NVIDIA NIM, LM Studio, Unsloth… Có thể trải nghiệm trực tiếp trên Google AI Studio (31B và 26B) và AI Edge Gallery (E4B và E2B). Từ lần phát hành đầu tiên, chuỗi Gemma đã được tải xuống hơn 400 triệu lượt, và cộng đồng đã tạo ra hơn 100 nghìn biến thể.

Xem bản gốc

Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.