Alibaba meluncurkan model AI "kompak" untuk dijalankan di smartphone
Raksasa teknologi China Alibaba Cloud telah meluncurkan model AI multimodal Qwen2.5-Omni-7B, yang mampu memproses teks, gambar, audio, video, serta menghasilkan respons teks dan suara secara real-time.
Jaringan syaraf memiliki 7 miliar parameter. Menurut perwakilan perusahaan, ia dapat dijalankan di perangkat periferal seperti ponsel dan laptop tanpa kehilangan efisiensi dan kinerja.
«Kombinasi unik ini menjadikan model sebagai dasar yang ideal untuk mengembangkan agen AI yang fleksibel dan ekonomis, yang memberikan manfaat nyata, terutama aplikasi suara cerdas», — demikian bunyi pengumuman tersebut.
Sebagai contoh aplikasi Qwen2.5-Omni-7B, perusahaan menyebutkan perbaikan kehidupan orang dengan gangguan penglihatan. Dengan bantuannya, mereka dapat lebih baik menavigasi lingkungan sekitar. Model ini mampu menganalisis bahan-bahan yang tersedia melalui video dan menawarkan panduan langkah demi langkah untuk memasak.
«Qwen2.5-Omni-7B memberikan kinerja yang mengesankan di semua modalitas, bersaing dengan model-model khusus yang sebanding dalam ukuran», — ditegaskan oleh perusahaan
Inovasi dijelaskan oleh arsitektur baru dan kumpulan data berkualitas tinggi yang digunakan untuk pelatihan
Perbandingan kinerja Qwen2.5-Omni-7B dengan pesaing. Data: Alibaba Cloud. Model ini memiliki sumber terbuka dan tersedia di Hugging Face, GitHub, ModelScope, dan Qwen Chat.
Sebagai pengingat, pada bulan Maret Alibaba memperkenalkan model AI QwQ-32 yang berfokus pada pemikiran.
Pada bulan Januari, raksasa teknologi China memperkenalkan Qwen 2.5-Max, yang konon lebih kuat daripada DeepSeek-V3.
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
Alibaba meluncurkan model AI "kompak" untuk dioperasikan di smartphone
Alibaba meluncurkan model AI "kompak" untuk dijalankan di smartphone
Raksasa teknologi China Alibaba Cloud telah meluncurkan model AI multimodal Qwen2.5-Omni-7B, yang mampu memproses teks, gambar, audio, video, serta menghasilkan respons teks dan suara secara real-time.
Jaringan syaraf memiliki 7 miliar parameter. Menurut perwakilan perusahaan, ia dapat dijalankan di perangkat periferal seperti ponsel dan laptop tanpa kehilangan efisiensi dan kinerja.
Sebagai contoh aplikasi Qwen2.5-Omni-7B, perusahaan menyebutkan perbaikan kehidupan orang dengan gangguan penglihatan. Dengan bantuannya, mereka dapat lebih baik menavigasi lingkungan sekitar. Model ini mampu menganalisis bahan-bahan yang tersedia melalui video dan menawarkan panduan langkah demi langkah untuk memasak.
Inovasi dijelaskan oleh arsitektur baru dan kumpulan data berkualitas tinggi yang digunakan untuk pelatihan
Sebagai pengingat, pada bulan Maret Alibaba memperkenalkan model AI QwQ-32 yang berfokus pada pemikiran.
Pada bulan Januari, raksasa teknologi China memperkenalkan Qwen 2.5-Max, yang konon lebih kuat daripada DeepSeek-V3.