Microsoft membuka sumber model embedding Harrier, memuncaki daftar peringkat MTEB multibahasa, unggul jauh dari OpenAI dan Google

robot
Pembuatan abstrak sedang berlangsung

Berita dari CoinDesk, tim Microsoft Bing telah merilis secara open source rangkaian model embedding bernama Harrier. Model embedding adalah komponen dasar dari mesin pencari dan sistem RAG, bertugas mengubah teks menjadi vektor agar dapat digunakan untuk penelusuran dan pencocokan; kualitasnya secara langsung menentukan apakah sistem AI dapat menemukan informasi yang tepat. Harrier-OSS-v1-27B edisi unggulan meraih skor rata-rata 74.3 pada benchmark multibahasa MTEB v2 (mencakup 131 tugas), melampaui skor tertinggi model open source sebelumnya sebesar 2 poin persentase, sekaligus menempati peringkat pertama. Dibandingkan dengan model tertutup, keunggulannya bahkan lebih besar: OpenAI text-embedding-3-large meraih skor rata-rata 58.92, Google Gemini Embedding 2 sebesar 69.9, dan Amazon Titan Embed v2 sebesar 60.37. Secara bersamaan, Microsoft juga merilis dua versi ringan open source untuk skenario deployment dengan daya komputasi rendah: 1. Versi 0.6B parameter: skor rata-rata 69.0, peringkat 10 di papan peringkat, dan sudah melampaui Google Gemini Embedding 1 (68.33). 2. Versi 270M parameter: skor rata-rata 66.5, peringkat 15 di papan peringkat, dengan ukuran paling kecil namun tetap mengungguli tiga versi model tertutup OpenAI dan Amazon. Ketiga versi mendukung lebih dari 100 bahasa dan jendela konteks 32K. Data pelatihan mencakup lebih dari 2 miliar pasangan teks weakly supervised (untuk perbandingan pretraining) dan 10 juta sampel berkualitas tinggi (untuk fine-tuning); data sintetis dihasilkan oleh GPT-5. Setelah model unggulan selesai, model ini juga digunakan sebagai model guru untuk meningkatkan performa dua model kecil melalui knowledge distillation. Microsoft menyatakan teknologi Harrier akan diintegrasikan ke dalam layanan penelusuran Bing dan layanan Agent generasi baru.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan