Lebih dari 3 tahun yang lalu, saat saya masih bermain sovits, model suara saat itu harus dipisahkan (menghilangkan suara latar belakang) untuk mendapatkan suara bersih sebelum pelatihan.


Kemudian perlu melakukan penyaringan pada dataset, menghapus bagian yang memiliki noise dasar yang besar, lalu mulai melakukan pelatihan.
Biasanya pelatihan sekitar 8000 langkah, suara yang dihasilkan paling optimal, jika melebihi 8000 langkah, dan skor masih di bawah 25, maka dataset dan pelatihan tersebut hampir tidak berguna. Jika Anda memaksa melanjutkan pelatihan hingga lebih dari 14000 langkah, akan muncul yang disebut “penyimpangan”, yang akhirnya menyebabkan suara yang dihasilkan menjadi either “elektronik berat” atau “tidak manusia, tidak hantu”.
Apakah ini mirip dengan langkah pengembangan perdagangan kuantitatif? Proses mengekstrak suara bersih adalah proses memberi mesin data untuk belajar sendiri dan membangun model prediksi, menghilangkan bagian yang noise dasar besar adalah menyaring data yang tidak valid (seperti fluktuasi besar dalam waktu 1 menit). Pelatihan 8000 langkah tidak akan menyebabkan overfitting yang serius, sedangkan pelatihan hingga 14000 langkah “penyimpangan” (overfitting parah) akhirnya membuat hasil nyata seperti lempar koin.
Meskipun tidak berada di jalur yang sama, logika dasarnya sama.
Mungkin suatu hari nanti, yang bisa mengalahkan kita bukan orang dari industri itu sendiri, melainkan orang dari bidang lain yang melangkah masuk, itu benar-benar sulit diprediksi...
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan