Perceptron mengubah bandwidth yang menganggur menjadi data pelatihan AI.

Sektor kecerdasan buatan saat ini menghadapi hambatan data pelatihan yang parah, terutama karena monopoli teknologi terpusat mengunci pengembang tahap awal dari saluran informasi berkualitas tinggi. Platform infrastruktur data terdesentralisasi Perceptron berusaha mengatasi hambatan struktural ini dengan menyebarkan lapisan infrastruktur terdesentralisasi yang mengumpulkan informasi web melalui perangkat pengguna sehari-hari.

Ringkasan

  • Perceptron menggunakan bandwidth konsumen yang menganggur untuk mengumpulkan data web yang tersedia untuk umum dan menyediakan dataset pelatihan AI dengan biaya lebih rendah.
  • Platform ini mengatakan jaringannya mencakup lebih dari 150 negara dan memberikan penghargaan kepada kontributor sambil memverifikasi kualitas data sebelum disuplai ke klien perusahaan.
  • Perceptron telah meluncurkan Dana Data AI senilai $10 juta untuk membantu pengembang mengakses infrastruktur data dan mempercepat pengembangan model AI.

Media modern sepenuhnya berfokus untuk menyoroti bagaimana nama-nama terkemuka di bidang kecerdasan buatan terus-menerus menggunakan sistem perangkat keras generasi terbaru untuk meningkatkan daya komputasi mentah mereka. Namun salah satu kendala operasional yang paling jarang dibahas adalah kualitas data pelatihan yang menjadi fondasi inti dari setiap model AI yang fungsional.

Masalahnya adalah dengan sebagian besar konten web terbuka yang sudah dipanen secara menyeluruh, kontrol korporat yang agresif atas antarmuka pemrograman aplikasi publik telah mengunci fondasi pengumpulan dataset yang tersisa di balik paywall multi-juta dolar yang selangit. Ini pada dasarnya telah menjadi hak istimewa eksklusif yang sangat mahal bagi segelintir monopoli teknologi raksasa.

Bagi raksasa teknologi yang saat ini memimpin perlombaan AI, mengamankan saluran informasi berbiaya tinggi ini bukanlah tantangan finansial yang besar, tapi bagaimana dengan inovator yang kekurangan dana? Tanpa anggaran yang memadai, startup tahap awal kesulitan membangun produk yang kompetitif.

“OpenAI membayar sekitar $60 juta hingga $100 juta per tahun kepada perusahaan seperti Reddit dan Twitter untuk dapat mengakses data melalui API,” kata Co-Founder & CEO Perceptron, Peter Anthony kepada crypto.news dalam sebuah wawancara baru-baru ini

“Banyak proyek AI baru di luar sana tidak memiliki anggaran untuk dapat menghabiskan $60 juta hingga $100 juta untuk dapat mengakses data. Jika Anda membangun model terbaik di dunia, itu cukup tidak berguna jika tidak memiliki akses ke data berkualitas baik. Anda bisa menjadi anak paling pintar di sekolah, tetapi jika Anda tidak dapat mengakses buku apa pun, Anda tidak benar-benar memiliki banyak informasi untuk disajikan.”

Anthony menyadari bahwa asimetri pasar ini menyisakan ruang bagi infrastruktur alternatif yang akan melayani segmen pasar independen, yang akhirnya membawanya untuk ikut mendirikan Perceptron, sebuah platform yang berencana menggunakan bandwidth konsumen yang menganggur untuk memecahkan “masalah hambatan data” yang diderita AI saat ini.

“Sebagian besar data dunia sudah diakses dan dikerok, tapi ada banyak data yang semacam tersembunyi di berbagai tempat yang belum dapat diakses, jadi kami mengumpulkan data dan memposisikan diri untuk dapat menyediakan data bagi perusahaan AI dengan biaya lebih rendah,” jelas Anthony.

Memanen bandwidth yang menganggur

Tapi apa bandwidth yang menganggur yang direncanakan Perceptron untuk dimanfaatkan? Anthony menjelaskan bahwa ini adalah aset ekonomi yang tidak diakui yang terus-menerus dihasilkan oleh pengguna sehari-hari melalui penjelajahan digital rutin, hanya untuk menyaksikan perusahaan-perusahaan besar mengekstrak dan mengambil keuntungan darinya.

“Saat ini, setiap kali Anda dan saya menggunakan internet di ponsel, komputer, kami menghasilkan data. Data itu dikumpulkan, dikemas menjadi dataset raksasa oleh perusahaan seperti Google, dan dijual seharga jutaan, terkadang miliaran dolar. Namun Anda dan saya tidak pernah melihat satu sen pun dari nilai itu.”

Apa yang telah dilakukan Perceptron adalah membalikkan model ekstraktif ini sepenuhnya. Mereka telah membangun jaringan yang mencakup lebih dari 150 negara yang terdiri dari sekitar 800.000 node, dan node-node ini didukung oleh pengguna individu yang hanya menjalankan ekstensi browser di Chrome atau aplikasi di perangkat Android mereka.

Meskipun instalasi titik akhir ini tidak mengerok file digital pribadi atau memberikan telemetri pribadi yang sensitif kepada perusahaan, instalasi ini malah mengamankan perspektif geografis lokal, yang digambarkan Anthony sebagai “sudut pandang berbeda” di web terbuka, yang kemudian dapat diekstrak dalam potongan kecil dan digabungkan menjadi satu dataset yang bermakna.

“Sangat penting bahwa kami fokus pada fakta bahwa ini tidak menggunakan data individu, tidak mengakses data dan informasi pribadi Anda sendiri, tapi katakanlah saat ini Anda di Malawi. Saat Anda melihat situs web tertentu, saya bisa pergi dan melihat situs web yang sama, tapi kemungkinan besar, karena saya di Dubai, kami akan melihat serangkaian hasil yang berbeda. Yang kami peroleh dari situasi ini hanyalah dapat menggunakan komputer Anda untuk melihat sesuatu seperti halaman web biasa, atau apa pun itu.”

Sebagai ilustrasi, Anthony mencatat bahwa jika klien perusahaan membutuhkan dataset posting media sosial terkait layanan kesehatan dari AS, Perceptron dapat berkoordinasi di seluruh jaring node globalnya untuk mengekstrak posting publik individu tanpa berinteraksi dengan API perusahaan yang restriktif

Karena data ini sudah dapat diakses secara bebas oleh publik melalui browser web standar, mengarahkan pengumpulan melalui node terminal individu secara hukum menghindari paywall komersial. Setelah paket data kecil ini diambil, jaringan mentransfer data mentah kembali ke server terpusat di mana model kecerdasan buatan khusus membersihkan dan mengaudit informasi untuk kontrol kualitas.

“Dengan melakukan ini, kami dapat memangkas biaya secara signifikan yang saat ini dibebankan oleh banyak perusahaan terpusat besar seperti Google.”

Didukung oleh putaran ekonomi yang memberikan insentif kepada peserta jaringan yang berkualitas

Pertanyaan selanjutnya adalah mengapa seseorang akan secara sukarela menyumbangkan perangkat keras mereka ke jaringan seperti ini, dan jawabannya sederhana, sebuah putaran nilai bersama yang memastikan bahwa node-node ini mendapatkan poin untuk konektivitas pasif mereka yang dijadwalkan untuk dikonversi menjadi token kripto asli di kemudian hari.

Menurut Anthony, model terdistribusi ini ”akan memungkinkan mereka mendapatkan poin” yang bertindak sebagai metrik langsung dari kontribusi jaringan mereka, dan oleh karena itu “setiap kali ada pendapatan yang dihasilkan oleh perusahaan, token akan diumpankan kembali ke ekosistem” untuk mempertahankan putaran ekonomi yang siklik.

“Akan ada juga token yang disisihkan yang digunakan untuk membeli kembali token,” tambahnya.

Namun, tidak semua orang yang menjalankan node pada dasarnya memenuhi syarat untuk mendapatkan hadiah yang konsisten, karena ada tantangan kontrol kualitas yang selalu ada, yang dapat mengorbankan integritas dataset jika dibiarkan tanpa pengawasan.

Perceptron mengatasi hal ini dengan mengarahkan paket yang terkumpul kembali ke server terpusat, di mana algoritma otomatis secara sistematis mengevaluasi masukan terhadap tolok ukur target sebelum melepaskan kompensasi apa pun.

Lebih lanjut, Anthony mengatakan bahwa startup tersebut baru-baru ini mengakuisisi perusahaan yang mengkhususkan diri dalam perangkat lunak verifikasi transaksi dan pembayaran untuk mengotomatiskan proses validasi ini secara struktural.

Untuk lebih melibatkan peserta jaringan sambil juga mendorong pembuatan kumpulan data, Perceptron juga berencana meluncurkan platform Data Questing yang terstruktur, yang akan memungkinkan kontributor untuk mengubah upaya manusia aktif menjadi masukan pelatihan yang unik.

“Kami bertujuan untuk secara efektif dapat membangun dataset dan membuat dataset yang saat ini tidak tersedia melalui proses terpusat,” tambah Anthony.

Tujuan akhir

Dalam jangka panjang, Anthony mengatakan dia ingin melihat jaringan bertransisi ke model yang berfokus pada intelijen bisnis yang mampu menyediakan analitik lapisan dalam untuk klien perusahaan

“Perbedaannya adalah bahwa dataset tradisional bersifat statis, mereka dikumpulkan sekali dan cepat menjadi usang. Tapi ada sejumlah besar data yang dihasilkan setiap kali Anda berinteraksi dengan apa pun secara online, dan saat ini, sebagian besar data itu hanya terbuang sia-sia,” kata Anthony.

“Satu server tunggal yang mencoba memantau semua pengguna yang berbeda ini tidak dapat benar-benar mengumpulkan intelijen yang bermakna pada skala itu. Yang kita butuhkan adalah pergeseran menuju intelijen bisnis yang terdistribusi, sehingga kita benar-benar dapat meningkatkan layanan di berbagai hal seperti e-commerce, perdagangan, dan masih banyak lagi.”

Perceptron juga telah meluncurkan Dana Data AI senilai $10 juta, di mana platform tersebut berharap dapat mendanai pengembang independen dan mendukung penerapan “proyek nyata yang menyediakan layanan nyata.” Berdasarkan ketentuan program, tim teknik yang terpilih menerima bantuan infrastruktur data khusus selama lima minggu dan hingga 5 TB data dunia nyata secara gratis untuk mempercepat optimalisasi model AI tahap awal.

“Tujuannya adalah untuk mendukung proyek saat mereka tumbuh dan kebutuhan data mereka meningkat. Kami dapat menjadi salah satu penyedia andalan mereka, ini adalah investasi dalam ekosistem yang lebih luas dan juga cara bagi kami untuk membangun pendapatan yang konsisten dan jangka panjang,” catat Anthony.

Pada saat publikasi, Anthony mengatakan Perceptron sudah aktif memasok beragam produk data ke berbagai perusahaan komersial. Jaringan ini menyediakan dataset gambar yang luas ke platform generatif teks-ke-video, termasuk perusahaan bernama Everlyn AI, untuk melatih model agar dapat mensintesis konten visual secara akurat.

Di luar itu, proyek ini juga melampaui kompilasi gambar standar, karena platform telah memasuki sektor analisis sentimen dengan melacak wacana publik di Twitter, YouTube, dan pasar aset digital. Menganalisis sentimen publik ini membantu perusahaan kripto dan bursa membangun alat pelacakan yang memberikan sinyal awal untuk mengantisipasi perubahan harga yang tiba-tiba.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Disematkan