Dasar
Spot
Perdagangkan kripto dengan bebas
Perdagangan Margin
Perbesar keuntungan Anda dengan leverage
Konversi & Investasi Otomatis
0 Fees
Perdagangkan dalam ukuran berapa pun tanpa biaya dan tanpa slippage
ETF
Dapatkan eksposur ke posisi leverage dengan mudah
Perdagangan Pre-Market
Perdagangkan token baru sebelum listing
Futures
Akses ribuan kontrak perpetual
TradFi
Emas
Satu platform aset tradisional global
Opsi
Hot
Perdagangkan Opsi Vanilla ala Eropa
Akun Terpadu
Memaksimalkan efisiensi modal Anda
Perdagangan Demo
Pengantar tentang Perdagangan Futures
Bersiap untuk perdagangan futures Anda
Acara Futures
Gabung acara & dapatkan hadiah
Perdagangan Demo
Gunakan dana virtual untuk merasakan perdagangan bebas risiko
Peluncuran
CandyDrop
Koleksi permen untuk mendapatkan airdrop
Launchpool
Staking cepat, dapatkan token baru yang potensial
HODLer Airdrop
Pegang GT dan dapatkan airdrop besar secara gratis
Launchpad
Jadi yang pertama untuk proyek token besar berikutnya
Poin Alpha
Perdagangkan aset on-chain, raih airdrop
Poin Futures
Dapatkan poin futures dan klaim hadiah airdrop
Investasi
Simple Earn
Dapatkan bunga dengan token yang menganggur
Investasi Otomatis
Investasi otomatis secara teratur
Investasi Ganda
Keuntungan dari volatilitas pasar
Soft Staking
Dapatkan hadiah dengan staking fleksibel
Pinjaman Kripto
0 Fees
Menjaminkan satu kripto untuk meminjam kripto lainnya
Pusat Peminjaman
Hub Peminjaman Terpadu
OpenAI Meluncurkan SWE-Lancer: Tolok Ukur AI Baru untuk Pemrograman Freelance Dunia Nyata
Temukan berita dan acara fintech teratas!
Berlangganan buletin FinTech Weekly
Dibaca oleh para eksekutif di JP Morgan, Coinbase, Blackrock, Klarna, dan lainnya
Standar Baru untuk Mengukur Kemampuan Coding AI di Ekonomi Gig
Kecerdasan buatan sedang melangkah ke dunia pengembangan perangkat lunak lepas (freelance) dengan tolok ukur baru yang dirancang untuk menguji kemampuan coding-nya terhadap tugas-tugas di dunia nyata. Disebut SWE-Lancer, tolok ukur ini, yang diperkenalkan oleh OpenAI, menilai performa AI dengan lebih dari 1.400 tugas rekayasa perangkat lunak freelance aktual dari Upwork, yang secara kolektif bernilai $1 juta dalam pembayaran.
Inisiatif ini bertujuan untuk memberikan gambaran yang lebih jelas tentang kemampuan AI dalam konteks profesional. Alih-alih mengandalkan masalah coding sintetis, SWE-Lancer menggunakan tugas yang telah diselesaikan dan dibayar oleh perusahaan nyata, sehingga memberikan ukuran yang lebih realistis tentang efektivitas AI dalam rekayasa perangkat lunak.
Pekerjaan Freelance Nyata, Tantangan Nyata
Sebagian besar tolok ukur coding AI berfokus pada masalah yang terdefinisi dengan baik dengan solusi yang dapat diprediksi. SWE-Lancer berbeda. Kumpulan datanya mencakup beragam jenis tugas, mulai dari perbaikan bug senilai $50 hingga implementasi fitur kompleks senilai $32.000. Beberapa penugasan menguji kemampuan AI untuk menulis kode, sementara yang lain memerlukan pengambilan keputusan—meniru peran manajer pengarah teknik dengan memilih di antara proposal teknis yang saling bersaing.
Untuk memastikan akurasi, uji end-to-end diverifikasi tiga kali oleh insinyur berpengalaman, dan pilihan manajerial dinilai berdasarkan keputusan dari manajer perekrutan asli. Tolok ukur ini tidak hanya mengukur apakah AI dapat menulis kode—melainkan mengevaluasi apakah kode tersebut memenuhi standar yang diharapkan oleh klien yang membayar.
Seberapa Baik Model AI Berkinerja?
Temuannya jelas: bahkan model AI paling canggih pun kesulitan dengan tugas-tugas ini. Meskipun AI telah membuktikan kemampuannya untuk menghasilkan cuplikan kode dan membantu debugging, AI masih tertinggal ketika harus menangani kompleksitas penuh dari pekerjaan rekayasa freelance. Tugas yang membutuhkan kreativitas, pemecahan masalah, dan perencanaan jangka panjang tetap menjadi tantangan.
Kesenjangan ini memiliki implikasi besar. Peran AI dalam pengembangan perangkat lunak terus berkembang, tetapi tolok ukur seperti SWE-Lancer menunjukkan bahwa coding yang sepenuhnya otonom masih jauh dari kenyataan. Untuk saat ini, insinyur manusia tetap menjadi kebutuhan, terutama untuk proyek-proyek kompleks yang melampaui sekadar pembuatan kode.
Open-Sourcing untuk Riset dan Wawasan Ekonomi
Untuk mendorong studi lebih lanjut, tim di balik SWE-Lancer telah membuat sumber daya kunci tersedia secara publik. Para peneliti dapat mengakses image Docker yang terintegrasi dan subset dari tolok ukur, yang disebut SWE-Lancer Diamond, untuk evaluasi. Dengan memetakan performa AI ke nilai moneter yang benar-benar terjadi, tolok ukur ini memberikan wawasan baru tentang bagaimana AI dapat memengaruhi ekonomi dan pasar kerja rekayasa perangkat lunak.
Di luar pengembangan perangkat lunak, wawasan ini bisa bernilai bagi perusahaan fintech dan bisnis yang bergantung pada tenaga freelance. Seiring model AI membaik, perusahaan akan membutuhkan cara yang lebih baik untuk mengukur dampak finansial dan operasional dari otomatisasi. SWE-Lancer menyediakan fondasi untuk memahami bagaimana AI mungkin berintegrasi ke dalam pekerjaan berbasis kontrak.
Langkah Menuju Masa Depan AI dalam Pengembangan Perangkat Lunak
Rilis SWE-Lancer menyoroti realitas penting: AI semakin maju, tetapi masih kesulitan menghadapi tuntutan dunia nyata dari rekayasa perangkat lunak freelance. Meskipun alat AI dapat membantu pengembang, alat tersebut belum dapat diandalkan sebagai pengganti yang andal untuk profesional yang terampil.
Seiring riset AI terus berlanjut, tolok ukur seperti SWE-Lancer akan membantu melacak kemajuan, menyempurnakan model, dan membentuk diskusi tentang dampak ekonomi dari otomatisasi. Apakah AI suatu hari nanti akan sepenuhnya menggantikan pengembang freelance masih belum pasti, tetapi untuk saat ini, sentuhan manusia dalam rekayasa perangkat lunak tetap tak tergantikan.