Chứng khoán Đông Ngô: Google(GOOGL.US) đã phát hành khả năng mô hình Gemma 4, thúc đẩy chu kỳ nâng cấp phần cứng thiết bị cuối cùng.

Chứng khoán thì xem báo cáo nghiên cứu của nhà phân tích Kim Qilin, uy tín, chuyên nghiệp, kịp thời, toàn diện—giúp bạn khai phá cơ hội theo chủ đề tiềm năng!

(Nguồn: ZhiTong Tài Kinh)

Ứng dụng ZhiTong Tài Kinh hay được biết rằng, Công ty Chứng khoán Đông Ngô công bố một báo cáo nghiên cứu, cho biết Google đã phát hành mô hình mã nguồn mở thuộc dòng Gemma 4, hỗ trợ suy luận Agent, đa phương thức (hình ảnh, video, âm thanh), ngữ cảnh dài và năng lực đa ngôn ngữ. Về mặt kỹ thuật, tập trung tối ưu hiệu quả bộ nhớ, giảm ngưỡng triển khai ở thiết bị đầu cuối, mở rộng phạm vi bao phủ thiết bị. Giấy phép Apache 2.0 được mở cho mục đích thương mại, kết hợp triển khai trên hệ sinh thái Android, được kỳ vọng sẽ thúc đẩy nâng cấp phần cứng ở phía thiết bị đầu cuối và mở ra chu kỳ đổi máy mới.

Các quan điểm chính của Công ty Chứng khoán Đông Ngô như sau:

Google phát hành mô hình mã nguồn mở Gemma4, năng lực Agent và đa phương thức được tăng cường toàn diện

Ngày 3/4, Google phát hành mô hình ngôn ngữ mã nguồn mở thế hệ mới Gemma 4, bao gồm 4 phiên bản E2B, E4B, 26B (MoE) và 31B (Dense). Tất cả các mô hình của Gemma4 hỗ trợ các năng lực sau: Agent và suy luận phức tạp: hỗ trợ suy luận nhiều bước và hoạch định logic phức tạp, có năng lực thực thi quy trình công việc tự chủ phù hợp với các tình huống sử dụng Agent, có thể gọi nhiều công cụ và API. Đa phương thức: tất cả các mô hình hỗ trợ gốc xử lý hình ảnh và video, đồng thời thể hiện tốt trong các nhiệm vụ như OCR và hiểu biểu đồ; trong đó, phiên bản E2B/E4B bổ sung hỗ trợ đầu vào âm thanh gốc. Tạo mã ngoại tuyến: hỗ trợ tạo mã trong môi trường cục bộ. Ngữ cảnh dài: mô hình nhỏ hỗ trợ cửa sổ ngữ cảnh 128K, còn mô hình lớn cao nhất hỗ trợ ngữ cảnh 256K, giúp nâng cao đáng kể năng lực xử lý tài liệu dài và các nhiệm vụ phức tạp. Năng lực đa ngôn ngữ: đã huấn luyện gốc trên hơn 140 ngôn ngữ.

Đổi mới kỹ thuật tập trung vào hiệu quả bộ nhớ và năng lực đa phương thức đi xuống, nâng cao khả năng gánh tác vụ ở phía thiết bị đầu cuối và mở rộng phạm vi bao phủ thiết bị

Xét theo lộ trình tiến hóa kỹ thuật, các vòng lặp của Gemma 4 được tối ưu xoay quanh các nút thắt cốt lõi khi triển khai ở phía thiết bị đầu cuối như bộ nhớ, năng lực tương tác. Cụ thể, 1) Ở cấp kiến trúc mô hình, tiếp tục cơ chế Per-Layer Embeddings (PLE); lấy E2B làm ví dụ, tổng số tham số khoảng 5B, nhưng khi suy luận thực tế chỉ cần tải khoảng 2B trọng số lõi, phần còn lại được gọi theo nhu cầu thông qua CPU. Sự thay đổi này hạ thấp ngưỡng yêu cầu phần cứng của thiết bị đầu cuối, giúp mô hình có thể chạy trên các thiết bị đầu cuối hiện có trong thị trường, qua đó mở rộng cơ sở thiết bị có thể tiếp cận của AI ở phía thiết bị đầu cuối. 2) Ở năng lực ngữ cảnh dài, nhờ thiết kế “cửa sổ trượt luân phiên + chú ý toàn cục” và Shared KVCache, hiệu quả sử dụng bộ nhớ được tối ưu mạnh mẽ: phần lớn các tầng chỉ xử lý token cục bộ, một số ít tầng chịu trách nhiệm mô hình hóa toàn cục; đồng thời tái sử dụng bộ nhớ đệm để tránh tính toán lặp lại, khiến nhu cầu KV cache giảm 74% so với cơ chế chú ý toàn phần truyền thống. Trong bối cảnh bộ nhớ ở phía thiết bị đầu cuối bị hạn chế, tối ưu này trực tiếp quyết định liệu mô hình có khả năng xử lý các tải công việc thực tế như tài liệu dài và hội thoại nhiều lượt hay không—đây là chìa khóa để AI ở phía thiết bị đầu cuối tiến tới công cụ tạo năng suất. 3) Ở ranh giới năng lực, Gemma 4 lần đầu hạ năng lực đa phương thức gốc của thị giác + âm thanh xuống các mô hình cấp 2B, tạo nền tảng kỹ thuật để điện thoại di động thực hiện các chức năng thường dùng như hiểu màn hình, giao tiếp bằng giọng nói, thao tác xuyên ứng dụng. Nhìn chung, đơn vị này cho rằng thông qua đổi mới kiến trúc, Gemma 4 vừa nâng cao rõ rệt năng lực xử lý các tác vụ đa phương thức hằng ngày của mô hình phía thiết bị đầu cuối, vừa hạ hiệu quả ngưỡng phần cứng một cách hiệu quả, mở rộng phạm vi thiết bị có thể tiếp cận; qua đó có ý nghĩa thúc đẩy nhanh nhịp độ ngành AI ở phía thiết bị đầu cuối.

Giấy phép mã nguồn mở được mở toàn diện, kết hợp triển khai hệ sinh thái Android, thúc đẩy nâng cấp phần cứng phía thiết bị đầu cuối và mở ra chu kỳ đổi máy mới

Xét từ góc độ hệ sinh thái, ở các thế hệ trước của dòng Gemma, giấy phép tùy chỉnh của Google được sử dụng, nên có một số hạn chế trong các kịch bản thương mại. Lần này, Gemma 4 chuyển sang giao thức Apache 2.0; trong điều kiện không bị ràng buộc bởi các chính sách sử dụng bắt buộc, cung cấp hoàn toàn quyền tự do thương mại, giúp giảm đáng kể ngưỡng để doanh nghiệp áp dụng, đồng thời có thể thu hút thêm nhà phát triển và khách hàng thương mại quay trở lại. Mặt khác, Gemma 4 sẽ đóng vai trò mô hình nền tảng cho Gemini Nano 4 và dự kiến được triển khai trong năm nay trên các thiết bị Android flagship thế hệ mới, đảm nhiệm vai trò “bệ đỡ mô hình” cho thế hệ tiếp theo ở phía thiết bị đầu cuối. Theo công bố chính thức, kể từ khi phiên bản đầu tiên được phát hành, lượng tải xuống tích lũy của Gemma đã vượt 400 triệu lượt, với hơn 100.000 mô hình dẫn xuất, bước đầu hình thành hệ sinh thái nhà phát triển Gemmaverse. Đơn vị này cho rằng, dưới tác động kép của việc nới lỏng giấy phép mã nguồn mở và việc đưa hệ sinh thái Android vào, năng lực nâng cấp của mô hình ở phía thiết bị đầu cuối do Gemma 4 đại diện có thể mở rộng đáng kể ranh giới năng lực của AI ở phía thiết bị đầu cuối; đồng thời tiếp tục thúc đẩy nâng cấp hiệu năng phần cứng đầu cuối và đổi mới sản phẩm theo hình thái mới, kéo theo chu kỳ đổi máy mới và các đột phá về danh mục sản phẩm.

Cảnh báo rủi ro: rủi ro đổi mới công nghệ không đạt kỳ vọng, rủi ro nhu cầu đầu cuối không đủ, rủi ro từ môi trường vĩ mô.

Nhiều thông tin phong phú, phân tích chính xác—tất cả có tại ứng dụng Sina Finance

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim