Dasar
Spot
Perdagangkan kripto dengan bebas
Perdagangan Margin
Perbesar keuntungan Anda dengan leverage
Konversi & Investasi Otomatis
0 Fees
Perdagangkan dalam ukuran berapa pun tanpa biaya dan tanpa slippage
ETF
Dapatkan eksposur ke posisi leverage dengan mudah
Perdagangan Pre-Market
Perdagangkan token baru sebelum listing
Futures
Akses ribuan kontrak perpetual
TradFi
Emas
Satu platform aset tradisional global
Opsi
Hot
Perdagangkan Opsi Vanilla ala Eropa
Akun Terpadu
Memaksimalkan efisiensi modal Anda
Perdagangan Demo
Pengantar tentang Perdagangan Futures
Bersiap untuk perdagangan futures Anda
Acara Futures
Gabung acara & dapatkan hadiah
Perdagangan Demo
Gunakan dana virtual untuk merasakan perdagangan bebas risiko
Peluncuran
CandyDrop
Koleksi permen untuk mendapatkan airdrop
Launchpool
Staking cepat, dapatkan token baru yang potensial
HODLer Airdrop
Pegang GT dan dapatkan airdrop besar secara gratis
Pre-IPOs
Buka akses penuh ke IPO saham global
Poin Alpha
Perdagangkan aset on-chain, raih airdrop
Poin Futures
Dapatkan poin futures dan klaim hadiah airdrop
Investasi
Simple Earn
Dapatkan bunga dengan token yang menganggur
Investasi Otomatis
Investasi otomatis secara teratur
Investasi Ganda
Keuntungan dari volatilitas pasar
Soft Staking
Dapatkan hadiah dengan staking fleksibel
Pinjaman Kripto
0 Fees
Menjaminkan satu kripto untuk meminjam kripto lainnya
Pusat Peminjaman
Hub Peminjaman Terpadu
Membangun Portofolio Aset Kripto yang Kuat dengan Strategi Multi-Faktor: Preprocessing Data
Pembukaan
Di bagian terakhir buku ini, kami menerbitkan artikel pertama dalam seri “Membangun Portofolio Aset Kripto yang Kuat dengan Strategi Multi-Faktor” - Fundamental Teoritis, dan ini adalah artikel kedua - Preprocessing Data.
Data perlu diproses sebelum / sesudah perhitungan data faktor, dan sebelum validitas faktor tunggal diuji. Preprocessing data spesifik melibatkan pemrosesan nilai duplikat, outlier / nilai yang hilang / nilai ekstrim, normalisasi, dan frekuensi data.
I. Nilai duplikat
Definisi terkait data:
Mendiagnosis nilai duplikat dimulai dengan memahami seperti apa data “seharusnya”. Biasanya data tersebut berupa:
Prinsip: Setelah Anda menentukan indeks (kunci) data, Anda dapat mengetahui pada tingkat apa data tidak boleh memiliki nilai duplikat.
Periksa metode:
PD. DataFrame.duplicated(subset=[key1, key2, …])
pd.merge(df1, df2, on=[key1, key2, …], indicator=True, validate=‘1:1’)
2. Pencilan/Nilai yang Hilang/Nilai Ekstrim
Penyebab umum pencilan:
Prinsip penanganan untuk pencilan dan nilai yang hilang:
Pembelajaran mesin harus digunakan dengan hati-hati untuk mengisi ulang dan mengambil risiko bias melihat ke depan
Penanganan nilai ekstrem:
Dengan mengatur urutan dari terkecil hingga terbesar, ganti data yang melebihi proporsi minimum dan maksimum dengan data kritis. Untuk data dengan data historis yang melimpah, metode ini relatif kasar dan tidak berlaku, dan menghapus secara paksa proporsi data yang tetap dapat menyebabkan persentase kerugian tertentu.
2.3Σ / Metode Simpangan Baku Tiga Kali Lipat
Standar deviasi σfactor mencerminkan tingkat dispersi distribusi data faktor, yaitu volatilitas. Rentang μ±3×σ digunakan untuk mengidentifikasi dan mengganti pencilan dalam himpunan data, dan sekitar 99,73% data jatuh ke dalam kisaran. Premis dari metode ini adalah bahwa data faktor harus mematuhi distribusi normal, yaitu, X∼N(μ,σ2).
di mana μ=∑ⁿi₌₁⋅Xi/N, σ²=∑ⁿi₌₁=(xi-μ)²/n, rentang nilai faktor yang wajar adalah [μ−3×σ, μ+3×σ].
Buat penyesuaian berikut untuk semua faktor dalam rentang data:
Kerugian dari metode ini adalah bahwa data yang biasa digunakan dalam bidang kuantitatif, seperti harga saham dan harga token, sering menunjukkan lonjakan dan distribusi ekor tebal, yang tidak sesuai dengan asumsi distribusi normal, dan dalam hal ini, sejumlah besar data akan salah diidentifikasi sebagai pencilan dengan menggunakan metode 3σ.
3.绝对值差中位数法(Median Absolute Deviation, MAD)
Metode ini didasarkan pada bias median dan absolut, membuat data yang diproses kurang sensitif terhadap ekstrem atau outlier. Lebih kuat dari metode berdasarkan mean dan standar deviasi.
Median deviasi absolut MAD=median ( ∑ⁿi₌₁(Xi - Xmedian) )
Rentang nilai faktor yang wajar adalah [Xmedian-n×MAD, Xmedian + n×MAD]. Buat penyesuaian berikut untuk semua faktor dalam rentang data:
Menangani kasus nilai ekstrim dari data faktor
kelas Ekstrim (objek): def init, ini_data): s.ini_data = ini_data
III. Standardisasi
x’i=(x−μ)/σ=(X−mean(X)))/std(X)2.Penskalaan Min-Maks
Mengubah setiap faktor menjadi data dalam interval (0,1) memungkinkan perbandingan data dengan ukuran atau rentang yang berbeda, tetapi tidak mengubah distribusi dalam data dan tidak membuat jumlah 1.
x’i=(xi−min(x))/max(x)-min(x)3.排序百分位(Penskalaan Peringkat)
Ubah fitur data menjadi peringkat mereka, dan ubah peringkat tersebut menjadi skor antara 0 dan 1, biasanya persentil mereka dalam himpunan data. *
Karena peringkat tidak terpengaruh oleh pencilan, metode ini tidak sensitif terhadap pencilan. **
NormRanki=(Peringkatₓi−min(Peringkatₓi))/max(Peringkatₓ)−min(Peringkatₓ)=Peringkatₓi/N
min(Rankₓ)=0, di mana N adalah jumlah total titik data dalam interval.
Menormalkan data faktor
kelas Scale (objek): def init, ini_data, tanggal): s.ini_data = ini_data s.date = tanggal
Keempat, frekuensi data
Terkadang data yang diperoleh tidak sesering yang kita butuhkan untuk analisis kita. Misalnya, jika tingkat analisis bulanan dan frekuensi data mentah harian, Anda perlu menggunakan “downsampling”, yaitu, data agregat bulanan.
DOWNSAMPLING
Ini mengacu pada agregasi data dalam koleksi ke dalam deretan data, seperti menggabungkan data harian ke dalam data bulanan. Dalam hal ini, perlu untuk mempertimbangkan karakteristik masing-masing indikator agregat, dan operasi yang biasa adalah:
Upsample
Ini mengacu pada pemisahan baris data menjadi beberapa baris data, seperti data tahunan untuk analisis bulanan. Ini biasanya pengulangan sederhana, dan kadang-kadang perlu untuk mengumpulkan data tahunan secara proporsional setiap bulan.
Falcon (/) adalah generasi baru infrastruktur investasi Web3 yang didasarkan pada model multi-faktor yang membantu pengguna “memilih”, “membeli”, “mengelola”, dan “menjual” aset kripto. Falcon diinkubasi oleh Lucida pada Juni 2022.
Lebih banyak konten tersedia untuk dikunjungi