Dasar
Spot
Perdagangkan kripto dengan bebas
Perdagangan Margin
Perbesar keuntungan Anda dengan leverage
Konversi & Investasi Otomatis
0 Fees
Perdagangkan dalam ukuran berapa pun tanpa biaya dan tanpa slippage
ETF
Dapatkan eksposur ke posisi leverage dengan mudah
Perdagangan Pre-Market
Perdagangkan token baru sebelum listing
Futures
Akses ribuan kontrak perpetual
TradFi
Emas
Satu platform aset tradisional global
Opsi
Hot
Perdagangkan Opsi Vanilla ala Eropa
Akun Terpadu
Memaksimalkan efisiensi modal Anda
Perdagangan Demo
Pengantar tentang Perdagangan Futures
Bersiap untuk perdagangan futures Anda
Acara Futures
Gabung acara & dapatkan hadiah
Perdagangan Demo
Gunakan dana virtual untuk merasakan perdagangan bebas risiko
Peluncuran
CandyDrop
Koleksi permen untuk mendapatkan airdrop
Launchpool
Staking cepat, dapatkan token baru yang potensial
HODLer Airdrop
Pegang GT dan dapatkan airdrop besar secara gratis
Launchpad
Jadi yang pertama untuk proyek token besar berikutnya
Poin Alpha
Perdagangkan aset on-chain, raih airdrop
Poin Futures
Dapatkan poin futures dan klaim hadiah airdrop
Investasi
Simple Earn
Dapatkan bunga dengan token yang menganggur
Investasi Otomatis
Investasi otomatis secara teratur
Investasi Ganda
Keuntungan dari volatilitas pasar
Soft Staking
Dapatkan hadiah dengan staking fleksibel
Pinjaman Kripto
0 Fees
Menjaminkan satu kripto untuk meminjam kripto lainnya
Pusat Peminjaman
Hub Peminjaman Terpadu
OpenAI Meluncurkan SWE-Lancer: Tolok Ukur AI Baru untuk Pemrograman Freelance Dunia Nyata
Temukan berita dan acara fintech teratas!
Berlangganan buletin FinTech Weekly
Dibaca oleh para eksekutif di JP Morgan, Coinbase, Blackrock, Klarna, dan lainnya
Standar Baru untuk Mengukur Kemampuan Coding AI di Ekonomi Gig
Kecerdasan buatan sedang melangkah ke dunia pengembangan perangkat lunak lepas (freelance) dengan tolok ukur baru yang dirancang untuk menguji kemampuannya dalam coding terhadap tugas-tugas dunia nyata. Disebut SWE-Lancer, benchmark ini, yang diperkenalkan oleh OpenAI, menilai performa AI menggunakan lebih dari 1.400 tugas aktual rekayasa perangkat lunak freelance dari Upwork, yang secara kolektif bernilai $1 juta dalam pembayaran.
Inisiatif ini bertujuan untuk memberikan gambaran yang lebih jelas tentang kemampuan AI dalam konteks profesional. Alih-alih mengandalkan soal-soal coding sintetis, SWE-Lancer menggunakan tugas yang telah diselesaikan dan dibayar oleh perusahaan nyata, sehingga menawarkan ukuran yang lebih realistis tentang efektivitas AI dalam rekayasa perangkat lunak.
Pekerjaan Freelance Nyata, Tantangan Nyata
Sebagian besar benchmark coding AI berfokus pada masalah yang terdefinisi dengan baik dengan solusi yang dapat diprediksi. SWE-Lancer berbeda. Kumpulan data ini mencakup beragam jenis tugas, mulai dari perbaikan bug senilai $50 hingga implementasi fitur kompleks senilai $32.000. Beberapa penugasan menguji kemampuan AI untuk menulis kode, sementara yang lain membutuhkan pengambilan keputusan—meniru peran manajer teknik dengan memilih di antara proposal teknis yang saling bersaing.
Untuk memastikan akurasi, uji end-to-end diverifikasi tiga kali oleh insinyur berpengalaman, dan pilihan manajerial dinilai berdasarkan keputusan dari para manajer perekrutan asli. Benchmark ini tidak hanya mengukur apakah AI dapat menulis kode—benchmark ini mengevaluasi apakah kode tersebut memenuhi standar yang diharapkan oleh klien yang membayar.
Seberapa Baik Model AI Berperforma?
Temuannya jelas: bahkan model AI paling canggih pun kesulitan dengan tugas-tugas ini. Meskipun AI telah membuktikan kemampuannya untuk menghasilkan cuplikan kode dan membantu debugging, AI masih tertinggal ketika harus menangani kompleksitas penuh pekerjaan rekayasa freelance. Tugas yang memerlukan kreativitas, pemecahan masalah, dan perencanaan jangka panjang tetap menjadi tantangan.
Kesenjangan ini memiliki implikasi besar. Peran AI dalam pengembangan perangkat lunak terus berkembang, tetapi benchmark seperti SWE-Lancer menunjukkan bahwa coding yang sepenuhnya otonom masih jauh dari kenyataan. Untuk saat ini, insinyur manusia tetap penting, terutama untuk proyek-proyek kompleks yang melampaui sekadar pembuatan kode sederhana.
Open-Sourcing untuk Riset dan Wawasan Ekonomi
Untuk mendorong studi lebih lanjut, tim di balik SWE-Lancer telah membuat sumber daya kunci tersedia secara publik. Para peneliti dapat mengakses citra Docker yang terintegrasi dan subset dari benchmark, yang disebut SWE-Lancer Diamond, untuk evaluasi. Dengan memetakan performa AI ke nilai moneter yang benar-benar terjadi, benchmark ini memberikan wawasan baru tentang bagaimana AI dapat memengaruhi ekonomi dan pasar kerja rekayasa perangkat lunak.
Di luar pengembangan perangkat lunak, wawasan ini dapat berharga bagi perusahaan fintech dan bisnis yang mengandalkan talenta freelance. Seiring membaiknya model AI, perusahaan akan memerlukan cara yang lebih baik untuk mengukur dampak finansial dan operasional dari otomasi. SWE-Lancer menawarkan fondasi untuk memahami bagaimana AI mungkin berintegrasi ke dalam pekerjaan berbasis kontrak.
Langkah Menuju Masa Depan AI dalam Pengembangan Perangkat Lunak
Peluncuran SWE-Lancer menyoroti kenyataan penting: AI terus berkembang, tetapi masih kesulitan menghadapi tuntutan dunia nyata dari rekayasa perangkat lunak freelance. Meskipun alat AI dapat membantu pengembang, alat tersebut belum dapat diandalkan sebagai pengganti yang andal untuk para profesional berpengalaman.
Seiring riset AI berlanjut, benchmark seperti SWE-Lancer akan membantu melacak kemajuan, menyempurnakan model, dan membentuk diskusi tentang dampak ekonomi dari otomasi. Apakah AI suatu saat akan sepenuhnya menggantikan pengembang freelance masih belum pasti, tetapi untuk saat ini, sentuhan manusia dalam rekayasa perangkat lunak tetap tak tergantikan.