Microsoft và Google cùng ngày công bố mô hình AI mới: khả năng nhận diện giọng nói, hình ảnh và mã nguồn mở địa phương cùng xuất trận

robot
Đang tạo bản tóm tắt

Microsoft và Google đều công bố các mô hình AI mới vào thứ Năm, nhưng sự khác biệt giữa hai bên là rất rõ ràng: Microsoft ra mắt mô hình nền tảng MAI mới, chỉ được cung cấp thông qua Azure Foundry và nền tảng MAI Playground chỉ dành cho Mỹ; trong khi Google giới thiệu mô hình mã nguồn mở hoàn toàn mới Gemma 4, có thể chạy trực tiếp trên máy. Ngoài ra, Google cũng đã chuyển giấy phép của các mô hình mã nguồn mở mới này sang Apache 2.0.

Ba mô hình MAI tự phát triển “tầm cỡ thế giới”

Ba mô hình MAI do Microsoft tự phát triển, tổng cộng gồm ba cái:

Đầu tiên là MAI-Transcribe-1, đây là một mô hình chuyển đổi âm thanh thành văn bản “tiên tiến nhất”, có khả năng hiểu 25 ngôn ngữ được sử dụng rộng rãi nhất trên toàn cầu, và tốc độ chuyển ghi hàng loạt nhanh hơn 2,5 lần so với giải pháp Azure Fast hiện có của Microsoft.

Tiếp theo là MAI-Voice-1, đây là một mô hình tạo giọng nói mới, chỉ cần 1 giây để tạo ra âm thanh dài 60 giây. Đồng thời, nó cũng hỗ trợ tạo giọng nói tùy chỉnh trong Microsoft Foundry thông qua các mẫu âm thanh ngắn.

Cuối cùng là MAI-Image-2, đây là một mô hình tạo ảnh từ văn bản nhanh hơn, hiện đã bắt đầu được đưa lên Copilot, và thời gian tới sẽ lần lượt được áp dụng cho Bing và PowerPoint.

Microsoft cho biết:

“Chúng tôi đang triển khai nhanh chóng những mô hình hàng đầu này để hỗ trợ các sản phẩm tiêu dùng và doanh nghiệp của chính mình. Rất nhanh thôi, bạn sẽ thấy nhiều mô hình hơn trong Foundry cũng như trong nhiều sản phẩm và trải nghiệm khác của Microsoft.”

Mô hình mã nguồn mở Gemma 4 do Google ra mắt

Mô hình mã nguồn mở Gemma 4 do Google phát hành áp dụng giấy phép Apache 2.0, thay vì tiếp tục sử dụng thỏa thuận cấp phép Gemma tùy chỉnh trước đó. Google cho biết các mô hình này có năng lực suy luận nâng cao, quy trình làm việc dạng tác nhân, tạo mã, và khả năng tạo hình ảnh lẫn âm thanh, đồng thời cung cấp bốn phiên bản khác nhau, được tối ưu cho việc chạy tại chỗ (local), thậm chí có thể chạy trên “hàng tỷ thiết bị Android”.

Google cho biết:

“Gemma 4 dựa trên nghiên cứu và công nghệ tầm cỡ thế giới tương tự như Gemini 3, và là một trong những bộ mô hình mạnh mẽ nhất mà bạn có thể chạy trực tiếp trên phần cứng tại chỗ. Chúng bổ sung cho các mô hình Gemini của chúng tôi, đồng thời mang đến cho các nhà phát triển bộ công cụ mã nguồn mở và công cụ độc quyền mạnh nhất trong ngành.”

Trong đó, các phiên bản Gemma 4 quy mô lớn hơn là 26B và 31B, nhắm đến việc chạy trên GPU dành cho người dùng phổ thông, có thể dùng để vận hành IDE, trợ lý lập trình và các quy trình làm việc dạng tác nhân. Còn các phiên bản nhẹ hơn E2B và E4B thì tập trung hơn vào khả năng đa phương thức và xử lý độ trễ thấp, phù hợp với thiết bị di động và thiết bị Internet vạn vật (bao gồm cả Raspberry Pi). Những mô hình này cũng hỗ trợ chạy hoàn toàn ngoại tuyến.

Các mô hình mã nguồn mở Gemma 4 của Google có thể tải xuống trên nhiều nền tảng, bao gồm Hugging Face, Kaggle và Ollama. Google nhấn mạnh:

“Những mô hình này, ở phương diện an toàn cơ sở hạ tầng, tuân thủ các giao thức an toàn nghiêm ngặt giống như các mô hình độc quyền của chúng tôi.”

Tin tức thêm, liên tục cập nhật

Cảnh báo rủi ro và điều khoản miễn trừ trách nhiệm

        Thị trường có rủi ro, đầu tư cần thận trọng. Bài viết này không cấu thành lời khuyên đầu tư cá nhân và cũng không xem xét các mục tiêu đầu tư đặc biệt của người dùng riêng lẻ, tình hình tài chính hoặc nhu cầu. Người dùng nên cân nhắc liệu bất kỳ ý kiến, quan điểm hoặc kết luận nào trong bài viết này có phù hợp với tình huống cụ thể của mình hay không. Do đó, nếu đầu tư theo đây, bạn hoàn toàn chịu trách nhiệm.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Gate Fun hot

    Xem thêm
  • Vốn hóa:$2.22KNgười nắm giữ:1
    0.00%
  • Vốn hóa:$2.23KNgười nắm giữ:1
    0.00%
  • Vốn hóa:$2.23KNgười nắm giữ:0
    0.00%
  • Vốn hóa:$2.24KNgười nắm giữ:2
    0.24%
  • Vốn hóa:$2.23KNgười nắm giữ:2
    0.00%
  • Ghim