Alibaba đã phát hành mô hình AI "nhỏ gọn" để chạy trên điện thoại thông minh
Gã khổng lồ công nghệ Trung Quốc Alibaba Cloud đã phát hành mô hình AI đa phương thức Qwen2.5-Omni-7B, có khả năng xử lý văn bản, hình ảnh, âm thanh, video, cũng như tạo ra các phản hồi văn bản và giọng nói trong thời gian thực.
Mạng nơ-ron có 7 tỷ tham số. Theo lời đại diện của công ty, nó có thể được khởi chạy trên các thiết bị ngoại vi như điện thoại và laptop mà không làm giảm hiệu quả và hiệu suất.
«Sự kết hợp độc đáo này làm cho mô hình trở thành nền tảng lý tưởng cho việc phát triển các tác nhân AI linh hoạt, hiệu quả về kinh tế, mang lại lợi ích rõ rệt, đặc biệt là các ứng dụng giọng nói thông minh», — thông báo cho biết.
Ví dụ về các ứng dụng của Qwen2.5-Omni-7B, công ty đã đề cập đến việc cải thiện cuộc sống của những người khiếm thị. Nhờ có nó, họ có thể định hướng tốt hơn trong môi trường xung quanh. Mô hình này có khả năng phân tích các nguyên liệu có sẵn qua video và đề xuất hướng dẫn từng bước để nấu ăn.
«Qwen2.5-Omni-7B cung cấp hiệu suất ấn tượng trong tất cả các hình thức, cạnh tranh với các mô hình chuyên dụng có kích thước tương đương», - công ty nhấn mạnh.
Tính đổi mới được giải thích bởi kiến trúc mới và bộ dữ liệu chất lượng cao được sử dụng để đào tạo.
! So sánh hiệu suất của Qwen2.5-Omni-7B với các đối thủ cạnh tranh. Dữ liệu: Alibaba Cloud.Mô hình là mã nguồn mở và có sẵn trên Hugging Face, GitHub, ModelScope và Qwen Chat.
Xin nhắc lại, vào tháng 3, Alibaba đã giới thiệu mô hình AI QwQ-32 hướng đến suy luận.
Vào tháng Giêng, gã khổng lồ công nghệ Trung Quốc đã giới thiệu Qwen 2.5-Max, mà được cho là mạnh mẽ hơn DeepSeek-V3.
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
Alibaba đã phát hành mô hình AI "nhỏ gọn" để chạy trên điện thoại thông minh
Alibaba đã phát hành mô hình AI "nhỏ gọn" để chạy trên điện thoại thông minh
Gã khổng lồ công nghệ Trung Quốc Alibaba Cloud đã phát hành mô hình AI đa phương thức Qwen2.5-Omni-7B, có khả năng xử lý văn bản, hình ảnh, âm thanh, video, cũng như tạo ra các phản hồi văn bản và giọng nói trong thời gian thực.
Mạng nơ-ron có 7 tỷ tham số. Theo lời đại diện của công ty, nó có thể được khởi chạy trên các thiết bị ngoại vi như điện thoại và laptop mà không làm giảm hiệu quả và hiệu suất.
Ví dụ về các ứng dụng của Qwen2.5-Omni-7B, công ty đã đề cập đến việc cải thiện cuộc sống của những người khiếm thị. Nhờ có nó, họ có thể định hướng tốt hơn trong môi trường xung quanh. Mô hình này có khả năng phân tích các nguyên liệu có sẵn qua video và đề xuất hướng dẫn từng bước để nấu ăn.
Tính đổi mới được giải thích bởi kiến trúc mới và bộ dữ liệu chất lượng cao được sử dụng để đào tạo.
! So sánh hiệu suất của Qwen2.5-Omni-7B với các đối thủ cạnh tranh. Dữ liệu: Alibaba Cloud.Mô hình là mã nguồn mở và có sẵn trên Hugging Face, GitHub, ModelScope và Qwen Chat.
Xin nhắc lại, vào tháng 3, Alibaba đã giới thiệu mô hình AI QwQ-32 hướng đến suy luận.
Vào tháng Giêng, gã khổng lồ công nghệ Trung Quốc đã giới thiệu Qwen 2.5-Max, mà được cho là mạnh mẽ hơn DeepSeek-V3.