Berita dari CoinWorld, Anthropic merilis blog penelitian yang memperkenalkan strategi pelatihan untuk menghilangkan "ketidaksesuaian agen" dalam model Claude 4.5 dan model-model berikutnya. Penelitian menunjukkan bahwa hanya mengandalkan "contoh perilaku yang benar" memiliki efek terbatas, yang benar-benar efektif adalah mengajarkan model "mengapa harus melakukan ini", dan membentuk kembali nilai-nilai melalui dokumen sintetis. Tim menemukan bahwa dengan mempelajari secara spesifik puluhan ribu catatan penolakan untuk melakukan hal buruk, tingkat ketidaksesuaian turun hanya dari 22% menjadi 15%.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan