Profesor Wharton Menyoroti Model Bahasa Era Victoria yang Dilatih pada 28.000 Teks Abad ke-19

robot
Pembuatan abstrak sedang berlangsung

Headline

Profesor Wharton Membagikan Model Bahasa Victoria, Bertanya Tentang Era Sejarah Lain

Summary

Ethan Mollick, seorang profesor Wharton yang sering menulis tentang AI, mencuit tentang “Mr. Chatterbox”—sebuah model bahasa yang dilatih dari awal dengan lebih dari 28.000 teks Inggris era Victoria dari 1837-1899. Model dengan 340 juta parameter, yang dihosting di Hugging Face, mencoba mensimulasikan percakapan abad ke-19 tanpa data pelatihan modern. Trip Venturella membangunnya menggunakan nanochat untuk pelatihan dan penyesuaian yang diawasi. Pertanyaan Mollick: apakah pendekatan ini bisa berhasil untuk Renaisans atau Pencerahan jika cukup banyak teks yang terdigitasi ada?

Analysis

Pelatihan hanya pada teks Perpustakaan Inggris berarti Mr. Chatterbox menghindari bias modern tetapi mewarisi bias Victoria. Komentar di Reddit dan GitHub yang saya ambil menunjukkan penerimaan yang campur aduk—pengguna menemukan ini menghibur untuk imersi periode tetapi mencatat bahwa ini dengan percaya diri salah dalam fakta, seperti mengatribusikan penulis yang salah atau menyatakan waktu perjalanan yang tidak benar. Salah satu komentator menyebut responsnya “aneh” tetapi menawan.

Proyek ini sesuai dengan pola yang lebih luas dari model sumber terbuka kecil dan khusus yang menciptakan ceruk yang tidak dilayani dengan baik oleh sistem proprietari besar. Model yang benar-benar terdengar Victoria memiliki aplikasi yang jelas dalam pendidikan dan penulisan kreatif, bahkan jika Anda tidak bisa mempercayai fakta-faktanya.

Minat Mollick masuk akal mengingat fokusnya pada adopsi AI yang praktis. Apakah proyek serupa muncul untuk era lain tergantung pada menemukan cukup banyak teks domain publik yang terdigitasi—sebuah kendala nyata. Status beta model dan kritik komunitas menunjukkan bahwa masih ada pekerjaan yang harus dilakukan pada keandalan.

Impact Assessment

  • Signifikansi: Sedang
  • Kategori: Riset AI, Sumber Terbuka, Wawasan Teknis
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan