Google giới thiệu Gemma 4 như mô hình AI mở tiên tiến nhất của họ cho các nhiệm vụ lý luận và tác vụ mang tính chất tác nhân (agentic), đồng thời cho biết đây là mô hình Open AI.

Google đã giới thiệu Gemma 4, dòng mô hình trí tuệ nhân tạo nguồn mở mới nhất của hãng, tập trung vào suy luận nâng cao và các quy trình làm việc theo kiểu tác nhân.

Tóm tắt

  • Google ra mắt Gemma 4, dòng mô hình AI nguồn mở mới nhất của hãng tập trung vào suy luận nâng cao và các quy trình làm việc theo kiểu tác nhân.
  • Mô hình có sẵn ở bốn kích cỡ, từ các biến thể cho thiết bị biên đến các hệ thống hiệu năng cao, và hỗ trợ hơn 140 ngôn ngữ.
  • Gemma 4 giới thiệu các tính năng như suy luận đa bước, công cụ cho tác nhân và tạo mã ngoại tuyến, với các mô hình có thể truy cập qua AI Studio và Edge Gallery.

Trong một bài đăng ngày 2 tháng 4 trên X, Demis Hassabis, giám đốc điều hành của Google DeepMind, đã công bố việc ra mắt Gemma 4, dòng mô hình trí tuệ nhân tạo nguồn mở mới nhất của hãng tập trung vào suy luận nâng cao và các quy trình làm việc theo kiểu tác nhân.

Các mô hình nguồn mở được thiết kế để nhà phát triển có thể sửa đổi và điều chỉnh, cho phép họ tùy biến hệ thống cho các trường hợp sử dụng cụ thể.

Việc phát hành diễn ra trong bối cảnh hệ sinh thái Gemma đang được đón nhận mạnh mẽ. Kể từ khi phiên bản đầu tiên ra mắt, các nhà phát triển đã ghi nhận hơn 400 triệu lượt tải xuống và tạo ra hơn 100.000 biến thể, theo Google.

Dòng mô hình bốn tầng nhắm tới phần cứng và trường hợp sử dụng đa dạng

Hassabis cho biết Gemma 4 có sẵn ở bốn kích cỡ, mỗi kích cỡ phù hợp với các loại khối lượng công việc và cấu hình phần cứng khác nhau, đồng thời có thể được tinh chỉnh cho các tác vụ chuyên biệt.

Phiên bản lớn nhất, 31B, là một mô hình dày đặc được xây dựng cho “hiệu năng thô tuyệt vời”, ưu tiên độ chính xác và chiều sâu của đầu ra, dù nó đòi hỏi tài nguyên tính toán cấp cao.

Bên cạnh đó là mô hình 26B Mixture of Experts (MoE), được thiết kế cho độ trễ thấp hơn. Nó kích hoạt ít tham số hơn trong quá trình suy luận, cho phép phản hồi nhanh hơn và cải thiện hiệu quả, dù có một số đánh đổi về chất lượng đầu ra.

Với các trường hợp sử dụng nhẹ hơn, Google đã giới thiệu các mô hình 2B và 4B. Chúng được tối ưu cho các thiết bị biên như điện thoại thông minh và các hệ thống nhỏ gọn, cho phép chạy trực tiếp trên thiết bị với yêu cầu tính toán thấp hơn.

Bạn có thể làm gì với Google Gemma 4?

Gemma 4 giới thiệu khả năng suy luận được cải thiện, cho phép nó xử lý các tác vụ đòi hỏi logic đa bước và giải quyết vấn đề có cấu trúc. Nó cũng cho thấy hiệu năng mạnh hơn trong các bài kiểm tra gắn với toán học và việc tuân theo hướng dẫn.

Các mô hình hỗ trợ các quy trình làm việc theo kiểu tác nhân thông qua gọi hàm gốc, đầu ra JSON có cấu trúc và các chỉ dẫn ở cấp hệ thống. Những tính năng này cho phép nhà phát triển xây dựng các hệ thống tự chủ có thể tương tác với API, công cụ và dịch vụ bên ngoài. Gemma 4 cũng cho phép tạo mã ngoại tuyến chất lượng cao, biến máy tính cục bộ thành các trợ lý lập trình do AI hỗ trợ.

Một tính năng quan trọng khác là cửa sổ ngữ cảnh được mở rộng. Các mô hình cho thiết bị biên hỗ trợ lên tới 128K token, trong khi các biến thể lớn hơn mở rộng con số này lên 256K token, cho phép xử lý các tài liệu dài hoặc cơ sở mã trong một lời nhắc duy nhất. Các mô hình được huấn luyện trên hơn 140 ngôn ngữ, giúp triển khai trên toàn cầu.

Sundar Pichai đã chia sẻ lại thông báo, nói rằng Gemma 4 đang “nhồi nhét một lượng trí tuệ đáng kinh ngạc cho mỗi tham số”.

Các mô hình được thiết kế để chạy trên nhiều loại phần cứng rất đa dạng, từ điện thoại thông minh và laptop đến GPU và trạm làm việc của nhà phát triển, với các biến thể nhỏ hơn có thể chạy cục bộ mà không cần truy cập internet liên tục.

Nhà phát triển có thể bắt đầu thử nghiệm Gemma 4 trên nhiều nền tảng, với các mô hình 31B và 26B MoE có sẵn trên Google AI Studio để phục vụ các trường hợp sử dụng hiệu năng cao hơn, trong khi các biến thể E2B và E4B nhỏ hơn có thể truy cập thông qua Google AI Edge Gallery cho các ứng dụng chạy trên thiết bị và các tác vụ nhẹ.

Công bố: Bài viết này không đại diện cho lời khuyên đầu tư. Nội dung và các tài liệu được nêu trên trang này chỉ nhằm mục đích giáo dục.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim