10 sampel diperluas menjadi 242 bahasa, Adaption Labs harus mengatasi kekurangan multibahasa AI dari tingkat data

robot
Pembuatan abstrak sedang berlangsung

Berita ME, 15 April (UTC+8), menurut pemantauan Beating dari Dongcha, platform data AI Adaption Labs merilis fitur baru Adaptive Data “Expand Your World”, yang dapat menghasilkan hingga 2.420 sampel pelatihan berkualitas tinggi yang mencakup 242 bahasa dan varian regional dari minimal 10 sampel dalam satu bahasa, tanpa proses anotasi tambahan atau pipeline data. Fitur ini telah tersedia untuk semua pengguna Adaptive Data.
Cakupan multibahasa adalah salah satu kekurangan utama data pelatihan AI. Sebagian besar dataset terkonsentrasi pada beberapa bahasa dengan sumber daya tinggi, kemampuan model dalam menangani bahasa kecil dan dialek regional secara signifikan lebih lemah, dan fine-tuning di kemudian hari sulit untuk sepenuhnya mengatasi kekurangan tersebut.
Pendekatan Adaption Labs adalah menempatkan cakupan bahasa di tingkat data, menyelesaikan bias distribusi sejak tahap pembuatan data pelatihan.
Adaption Labs didirikan oleh mantan Wakil Presiden Riset Cohere Sara Hooker dan mantan insinyur infrastruktur AI Google Sudip Roy, dan pada Februari tahun ini mendapatkan pendanaan tahap awal sebesar 50 juta dolar dari Emergence Capital, dengan valuasi 1 miliar dolar.
Inti dari perusahaan ini adalah menggantikan ekspansi masif dengan sistem adaptif yang efisien, memungkinkan model untuk terus belajar dan berkembang.
(Sumber: BlockBeats)

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan