Andrej Karpathy telah mengirimkan llm.c: sebuah proyek kecil satu file, melatih model setingkat GPT-2 dari nol. AI alpha sejati besar kemungkinan bukan hanya mengikuti nama model berikutnya, tetapi menjalankan sendiri siklus tertutup terkecil dari model tersebut. Mereka yang memahami bagaimana bobot (weights) dilatih langkah demi langkah, nanti saat melihat agen, alat, dan peluang komputasi, akan lebih cepat dari si kecil yang hanya menghafal catatan rilis.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Disematkan