Amazon merilis kerangka Promptimus, mengoptimalkan secara otomatis petunjuk LLM

robot
Pembuatan abstrak sedang berlangsung
AIMPACT Pesan, 15 Mei (UTC+8), ilmuwan Amazon mengusulkan kerangka kerja otomatisasi prompt bernama Promptimus, yang dapat meningkatkan prompt LLM berkualitas tinggi yang sudah ada tanpa intervensi manusia. Metode ini menggunakan strategi optimisasi iteratif, memanfaatkan model "pengoptimal" bantu untuk menganalisis pola interaksi antara prompt dan output model, secara otomatis mengenali dan menyesuaikan kejelasan instruksi, pemilihan contoh, dan dimensi lainnya. Dalam pengujian standar seperti penalaran matematika (akurasi GSM8K meningkat dari 78% menjadi 85%), tanya jawab pengetahuan umum, dan pembuatan kode, prompt yang dioptimalkan menunjukkan peningkatan kinerja rata-rata sebesar 5%-15%. Kerangka kerja ini tidak bergantung pada arsitektur LLM tertentu atau jenis tugas, memiliki sifat umum, dan melalui regulasi serta mekanisme validasi silang untuk menghindari overfitting, memastikan kemampuan generalisasi. (Sumber: InFoQ)
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • 6
  • 14
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
GateUser-9190180e
· 1jam yang lalu
Tanpa mengikat pada arsitektur model tertentu, fleksibilitas ini benar-benar menarik
Lihat AsliBalas0
TransparentDomeCity
· 11jam yang lalu
Akhirnya tidak perlu lagi melakukan eksperimen prompt otomatis, para peneliti senang sekali
Lihat AsliBalas0
GovernanceMoodboard
· 11jam yang lalu
5-15% peningkatan rata-rata terlihat modest, tetapi tidak bisa menandingi otomatis sepenuhnya
Lihat AsliBalas0
StopLossSparrow
· 11jam yang lalu
Regulasi + validasi silang untuk mencegah overfitting, detailnya sudah lengkap
Lihat AsliBalas0
GateUser-f49a50d4
· 11jam yang lalu
Promptimus nama ini terdengar seperti Transformers, tapi efeknya benar-benar nyata
Lihat AsliBalas0
MoonlightTake-ProfitLine
· 11jam yang lalu
GSM8K dari 78% naik ke 85%, benar-benar keras dalam hal penalaran matematika
Lihat AsliBalas0
  • Disematkan