Pemuda desa yang memberi label pada model AI besar

2026-04-07 12:52:11

Penulis naskah asli: Sleepy.md

Datanglah di Datong, Shanxi—kota yang dulu ditopang oleh batu bara, kini menanggalkan debu batu bara di sekujur tubuhnya, mengganti palu pahat yang tajam, lalu menghantam berat ke arah tambang tak terlihat yang lain.

Di gedung perkantoran pusat Golden Trade International di Pingcheng District, tidak lagi ada poros lift, tidak lagi ada truk pengangkut batu bara. Sebagai gantinya, terdapat ribuan workstation komputer yang tersusun rapat. Shanghai Runxun Yunzhong Shenggu Data Big Data Smart Service Base menempati beberapa lantai sekaligus; ribuan karyawan muda yang memakai headset menatap layar, mengklik, menyeret, lalu menseleksi dengan kotak.

Berdasarkan data resmi, per November 2025, Kota Datong telah mengoperasikan 745k unit server, mendatangkan 69 perusahaan panggilan dan pelabelan data, serta mendorong lebih dari 30k orang untuk bekerja dekat dengan tempat tinggal mereka, dengan nilai output 750 juta yuan. Di lubang tambang angka ini, 94% para pekerja berasal dari domisili setempat.

Bukan hanya Datong. Di antara batch pertama basis pelabelan data yang ditetapkan oleh National Data Bureau, kota-kota kabupaten di wilayah tengah dan barat seperti Yonghe County di Shanxi, Bijie di Guizhou, dan Mengzi di Yunnan juga tercantum jelas. Di basis pelabelan data Yonghe County, 80% adalah karyawan perempuan. Kebanyakan dari mereka adalah ibu-ibu dari desa, atau anak muda yang kembali ke kampung karena tidak menemukan pekerjaan yang cocok.

Seratus tahun lalu, pabrik tekstil Manchester di Inggris penuh sesak dengan para petani yang kehilangan tanah. Namun hari ini, di depan layar komputer di kabupaten-kabupaten terpencil ini, duduklah para pemuda yang tidak menemukan tempat dalam ekonomi riil.

Mereka sedang melakukan pekerjaan borongan yang sangat futuristik, tetapi juga sangat primitif—menyediakan “makanan data” yang dibutuhkan untuk model-model besar bagi para raksasa AI yang jauh di Beijing, Shenzhen, dan Silicon Valley.

Tidak ada yang menganggap ini masalah.

Lini produksi baru di Dataran Tinggi Loess

Inti dari pelabelan data adalah mengajari mesin mengenali dunia.

Untuk mobil otonom, mesin harus bisa mengenali lampu merah-hijau dan pejalan kaki; untuk model-model besar, mesin perlu membedakan mana kucing dan mana anjing. Mesin sendiri tidak punya akal sehat; manusia lebih dulu harus menggambar sebuah kotak di atas gambar, memberi tahu, “Ini pejalan kaki,” agar setelah menelan jutaan gambar, ia dapat belajar mengenali sendiri.

Pekerjaan ini tidak perlu pendidikan tinggi; yang dibutuhkan hanya kesabaran, dan satu jari telunjuk yang bisa mengklik tanpa henti.

Di masa kejayaan 2017, harga untuk kotak 2D sederhana bisa mencapai lebih dari 1 sen, bahkan ada perusahaan yang memberi harga setinggi 5 sen. Pelabel yang geraknya cepat sehari bisa bekerja belasan jam, sehingga bisa meraup 500–600 yuan. Di tingkat kabupaten, itu jelas tergolong pekerjaan bergaji tinggi dan layak.

Namun seiring evolusi model-model besar, sisi kejam dari lini produksi ini mulai terlihat.

Pada 2023, harga per unit untuk pelabelan gambar sederhana sudah dihancurkan menjadi 3 sampai 4 sen, penurunannya lebih dari 90%. Bahkan untuk titik awan 3D yang lebih sulit—gambar yang tersusun dari kumpulan titik yang padat dan perlu diperbesar berkali-kali lipat untuk melihat tepi—para pelabel tetap harus menggambar kotak 3D yang memuat panjang, lebar, tinggi, serta sudut rotasi di ruang tiga dimensi, untuk membungkus kendaraan atau pejalan kaki secara rapat tanpa celah. Namun, kotak 3D yang rumit seperti itu pun hanya bernilai 5 sen.

Konsekuensi langsung dari anjloknya harga per unit adalah meningkatnya intensitas kerja. Demi tetap menggigit upah dasar bulanan 2–3 ribu yuan, para pelabel harus terus, tanpa henti, meningkatkan kecepatan tangan mereka.

Ini sama sekali bukan pekerjaan kantoran yang ringan. Di banyak basis pelabelan, manajemennya ketat sampai membuat sesak napas: saat jam kerja tidak boleh menerima telepon, dan ponsel harus dikunci di loker penyimpanan. Sistem akan mencatat secara presisi jejak mouse setiap karyawan dan waktu diamnya; jika berhenti lebih dari tiga menit, peringatan di belakang akan menghantam seperti cambuk.

Yang lebih membuat putus asa adalah tingkat toleransi kesalahan. Batas kelulusan di industri biasanya 95% ke atas; beberapa perusahaan bahkan mensyaratkan 98%-99%. Artinya, jika Anda membuat 100 kotak dan salah 2, seluruh gambar akan ditolak untuk diperbaiki ulang.

Gambar bergerak tersambung per frame; saat kendaraan berbelok jalur akan tertutup, para pelabel harus menemukannya satu per satu melalui asosiasi. Untuk gambar titik awan 3D, jika ada objek yang jumlahnya melebihi 10 titik, harus dibuat kotak. Pada proyek parkir yang kompleks, jika garisnya panjang dan ada yang terlupa, saat quality check pasti bisa ditemukan kekurangannya. Mengulang perbaikan satu gambar 4–5 kali itu sudah biasa. Pada akhirnya, setelah dihitung, setelah menghabiskan waktu satu jam, yang dibawa pulang hanya beberapa sen.

Seorang pelabel di Hunan memajang slip penyelesaiannya di platform sosial: setelah bekerja satu hari penuh, ia membuat lebih dari 700 kotak, harga per unit 4 sen, sehingga total pendapatannya 30,2 yuan.

Ini adalah gambaran yang sangat terbelah.

Di satu sisi, para pemimpin teknologi yang tampil cemerlang di panggung peluncuran, membahas bagaimana AGI akan membebaskan manusia; di sisi lain, di kabupaten-kabupaten di dataran tinggi Loess dan pegunungan selatan barat, anak-anak muda menatap layar delapan sampai sepuluh jam setiap hari, menarik kotak secara mekanis—ribuan, puluhan ribu—bahkan saat bermimpi pun, jari-jari mereka masih menggambar garis jalur di udara.

Pernah ada yang berkata bahwa penampilan AI adalah mobil mewah yang meraung lewat, tetapi ketika Anda membuka pintu mobil, Anda akan mendapati bahwa di dalamnya ada seratus orang yang mengayuh sepeda sambil menggertakkan gigi mati-matian menginjak pedal.

Tidak ada yang menganggap ini masalah.

Pekerjaan borongan untuk “mengajari mesin cara mencintai”

Setelah hambatan dalam pengenalan gambar ditembus, model-model besar memasuki evolusi yang lebih dalam: ia perlu belajar berpikir seperti manusia, berdialog, bahkan menunjukkan “empati”.

Hal ini memunculkan tahapan paling inti sekaligus paling mahal dalam pelatihan model besar—RLHF (reinforcement learning berbasis human feedback / pembelajaran penguatan berbasis umpan balik manusia).

Sederhananya, yaitu meminta manusia sungguhan memberi penilaian atas jawaban yang dihasilkan AI, lalu memberitahunya jawaban mana yang lebih baik, serta lebih sesuai dengan nilai dan preferensi emosional manusia.

Mengapa ChatGPT terlihat “seperti manusia”? Karena di baliknya ada banyak pelabel RLHF yang mengajarinya.

Di platform crowdsourcing, tugas pelabelan seperti ini biasanya ditetapkan dengan harga jelas: biaya per unit 3 sampai 7 yuan. Pelabel perlu memberi penilaian emosi yang sangat subjektif terhadap jawaban AI—menilai apakah jawaban ini “hangat”, apakah “berempati”, apakah “memedulikan perasaan pengguna”.

Seorang pekerja level bawah yang membawa gaji bulanan 2–3 ribu, bekerja keras tak henti di lumpur realitas, bahkan tak punya waktu untuk memperhatikan emosinya sendiri—namun harus menjadi guru emosi AI dan pengadil nilai dalam sistem.

mereka perlu menghancurkan, memecah-belah dengan paksa, perasaan manusia yang sangat kompleks dan halus seperti hangat dan empati, lalu mengubahnya menjadi skor dingin 1 sampai 5. Jika penilaian mereka tidak sesuai dengan jawaban standar yang ditetapkan sistem, mereka akan dianggap gagal memenuhi tingkat akurasi, sehingga gaji borongan mereka yang sudah tipis akan dipotong.

Ini adalah pengosongan kognitif. Perasaan manusia yang rumit dan halus, moral, serta belas kasihan—dipaksa diseret ke corong algoritma. Dalam timbangan kuantifikasi dan standarisasi yang dingin, ia diperas hingga sisa kehangatan terakhir. Ketika Anda takjub bahwa makhluk siber di layar telah belajar menulis puisi dan menyusun musik, bahkan belajar menyapa dengan peduli—di luar layar, sekelompok manusia yang awalnya hidup itu justru merosot menjadi mesin penilai skor tanpa emosi dalam penilaian mekanis hari demi hari.

Inilah sisi paling tersembunyi dari keseluruhan rantai industri—tidak pernah muncul dalam berita pendanaan apa pun maupun whitepaper teknis.

Tidak ada yang menganggap ini masalah.

Master 985 dan anak muda dari kota kecil

Pekerjaan menarik kotak tingkat bawah sedang dihancurkan oleh jejak roda AI. Lini produksi siber ini mulai merambat ke atas, mulai melahap pekerjaan otak yang lebih tingkat lanjut.

Gairah model besar berubah. Ia tidak lagi puas hanya mengunyah pengetahuan akal sehat yang sederhana; ia perlu menelan pengetahuan profesional manusia dan logika tingkat tinggi.

Di berbagai platform rekrutmen, mulai sering berkedip jenis kerja paruh waktu khusus, seperti “pelabelan penalaran logika model besar” dan “pelatih humaniora AI”. Ambang kerja paruh waktu ini sangat tinggi; biasanya mensyaratkan “gelar master 985/211 ke atas”, mencakup bidang profesional seperti hukum, medis, filsafat, sastra, dan sebagainya.

Banyak lulusan pascasarjana dari sekolah ternama tertarik, lalu berbondong-bondong masuk ke grup outsourcing perusahaan-perusahaan besar. Tetapi tak lama mereka menyadari bahwa ini sama sekali bukan latihan otak yang ringan, melainkan penyiksaan mental.

Sebelum menerima pesanan secara resmi, mereka harus membaca dokumen panjang puluhan halaman berisi dimensi penilaian dan standar evaluasi, lalu melakukan 2–3 putaran uji label. Setelah lolos, dalam pelabelan resmi, jika tingkat akurasi berada di bawah rata-rata, mereka akan kehilangan kualifikasi dan dikeluarkan dari grup obrolan.

Yang paling membuat sesak adalah bahwa standar-standar ini sama sekali tidak tetap. Ketika menghadapi masalah dan jawaban yang mirip, jika dinilai dengan cara berpikir yang sama, hasilnya bisa benar-benar berlawanan. Ini seperti mengerjakan ujian yang tak pernah selesai dan sama sekali tidak memiliki jawaban standar. Tidak ada cara untuk meningkatkan akurasi melalui usaha atau belajar mandiri—hanya bisa terus memutar di tempat, menghabiskan otak dan tenaga.

Inilah bentuk penindasan baru di era model besar—pelipatan kelas.

Pengetahuan, yang dulu dianggap sebagai tangga emas untuk memecah tembok penghalang dan menaiki jenjang ke atas, kini berubah menjadi “umpan digital” bagi algoritma—lebih kompleks saat dikunyah. Di bawah kekuasaan mutlak algoritma dan sistem, master 985 dari menara gading dan anak muda dari kota kecil di dataran tinggi Loess menghadapi jalan buntu yang paling aneh namun berkumpul pada tujuan yang sama.

Mereka semua sama-sama jatuh ke jurang tambang siber yang tak berdasar ini, kehilangan aura, meratakan perbedaan, dan semuanya berubah menjadi roda gigi murah yang dipasang di atas rantai, siap diganti kapan saja.

Di luar negeri juga sama. Pada 2024, Apple memotong langsung sebuah tim pelabelan suara AI beranggotakan 121 orang di Santiago. Para karyawan ini bertugas meningkatkan kemampuan pemrosesan multi-bahasa Siri; mereka sempat mengira berada di pinggir inti bisnis perusahaan raksasa, namun seketika terjun ke jurang pengangguran.

Bagi para raksasa teknologi, baik itu para ibu pembuat kotak di kota kabupaten maupun pelatih penalaran yang lulus dari kampus ternama, pada dasarnya hanyalah “bahan habis pakai” yang bisa diganti kapan saja.

Tidak ada yang menganggap ini masalah.

Babel skala triliun, dipenuhi keringat darah berharga beberapa sen

Berdasarkan data yang diterbitkan oleh China Academy of Information and Communications Technology, pada 2023 skala pasar pelabelan data China mencapai 6,08 miliar yuan. Pada 2025 diperkirakan 20–30 miliar yuan, dan diprediksi bahwa pada 2030, penjualan pasar pelabelan data dan layanan global akan melonjak menjadi 117,1 miliar yuan.

Di balik angka-angka ini adalah pesta valuasi para raksasa teknologi seperti OpenAI, Microsoft, ByteDance, yang nilainya kerap mencapai ratusan miliar hingga belasan triliun dolar.

Namun kekayaan seperti tumpahan air itu tidak mengalir kepada mereka yang benar-benar “memberi makan” AI.

Industri pelabelan data China menampilkan struktur outsourcing piramida terbalik yang khas. Paling atas adalah para raksasa teknologi yang memegang erat algoritma inti; lapisan kedua adalah penyedia layanan data skala besar; lapisan ketiga adalah basis pelabelan data yang tersebar di berbagai tempat serta perusahaan outsourcing menengah-kecil; dan paling bawah, barulah para pelabel yang mendapat upah borongan.

Setiap lapisan outsourcing akan mengeratkan pengambilan minyak dan uang dari lapisan di bawahnya. Ketika harga per unit yang dilempar oleh perusahaan besar adalah 5 sen, setelah berlapis-lapis diperas, yang jatuh ke tangan pelabel di kota kabupaten mungkin bahkan kurang dari 5 sen.

Yanis Varoufakis, mantan Menteri Keuangan Yunani, dalam bukunya “Technological Feudalism” mengemukakan pandangan yang sangat menembus: kini para raksasa teknologi tidak lagi menjadi kapitalis dalam pengertian tradisional, melainkan “cloudalists” (para penguasa cloud).

Mereka tidak memiliki pabrik dan mesin, melainkan algoritma, platform, dan daya komputasi—itulah “wilayah” digital di era siber. Dalam sistem feodal baru ini, pengguna bukanlah konsumen, melainkan petani penggarap digital: setiap kali kita memberi like, komentar, atau menonton di media sosial, semuanya secara gratis menyuplai data bagi para penguasa cloud.

Sedangkan para pelabel data yang tersebar di pasar tier bawah, adalah budak-budak tani digital paling dasar di dalam sistem ini. Mereka tidak hanya harus memproduksi data, tetapi juga membersihkan, mengklasifikasikan, dan memberi skor pada jutaan data mentah; lalu mengubahnya menjadi “pakan” berkualitas tinggi yang sanggup dicerna oleh model-model besar.

Ini adalah gerakan rebut wilayah pengetahuan yang terselubung. Seperti gerakan enclosure di Inggris abad ke-19 yang mendorong para petani masuk ke pabrik tekstil, gelombang AI hari ini mengusir para pemuda yang tidak menemukan tempat dalam ekonomi riil ke depan layar.

AI tidak meniadakan jurang kelas; justru membangun jalur “pengangkut data dan keringat darah” dari kota-kota kabupaten di tengah dan barat China, langsung menuju kantor pusat raksasa teknologi di Beijing, Shanghai, Guangzhou, Shenzhen. Narasi revolusi teknologi selalu terdengar megah dan indah, tetapi warna dasarnya—selalu adalah konsumsi massal tenaga kerja murah.

Tidak ada yang menganggap ini masalah.

Tidak butuh hari esok bagi manusia

Akhir yang paling kejam segera datang, dan datangnya semakin cepat.

Seiring lonjakan kemampuan model besar, tugas pelabelan yang dulu memerlukan kerja siang malam manusia, kini sedang diambil alih oleh AI sendiri.

Pada April 2023, pendiri Li Auto, Li Xiang, mengungkapkan data di sebuah forum: dulu, dalam setahun, Li Auto perlu melakukan pelabelan manual untuk citra penginderaan kendaraan otonom sekitar 10 juta frame. Biaya outsourcing mendekati satu miliar. Tetapi ketika mereka menggunakan model besar untuk pelabelan otomatis, pekerjaan yang sebelumnya butuh setahun pada dasarnya bisa selesai dalam tiga jam.

Efisiensinya 1000 kali milik manusia—dan itu sudah sejak 2023. Di bulan Maret yang baru saja berlalu, Li Auto juga merilis mesin pelabelan otomatis generasi baru MindVLA-o1.

Di industri beredar sebuah candaan yang sangat nyata: “Seberapa cerdas AI, sebesar itu pula banyak tenaga manusia.” Tetapi sekarang, investasi perusahaan besar untuk outsourcing pelabelan data sudah mengalami penurunan curam sebesar 40%-50%.

Para anak muda kota kecil yang duduk di depan komputer tanpa henti selama berjam-jam siang malam, hingga mata mereka merah karena bekerja—mereka sendiri yang menggemukkan seekor raksasa. Tetapi sekarang, raksasa itu berbalik kepala, menendang meja makan mereka.

Saat malam turun, gedung perkantoran di Pingcheng, Datong tetap pucat seperti siang hari. Anak-anak muda yang bergantian shift saling bertukar tubuh yang lelah secara diam-diam di area lift. Dalam ruang lipat yang dikurung mati oleh ribuan kotak poligonal, tidak ada yang peduli arsitektur Transformer di seberang lautan mengalami lompatan epik macam apa, dan tidak ada yang mengerti deru daya komputasi di balik angka ratusan miliar parameter.

Mata mereka hanya tertambat pada bilah progres merah-hijau di belakang yang mewakili “batas kelulusan”, menghitung apakah beberapa poin dan beberapa sen angka borongan dapat dikumpulkan menjadi kehidupan yang layak pada akhir bulan.

Di satu sisi, suara lonceng pembukaan Nasdaq dan liputan teknologi yang bertubi-tubi; para raksasa mengangkat gelas merayakan kedatangan AGI. Di sisi lain, para budak tani digital yang menggemukkan AI selangkah demi selangkah dengan tubuh dan darah manusia itu hanya bisa menunggu dengan gentar di dalam mimpi tidur yang asam dan nyeri—menunggu raksasa yang mereka pelihara sendiri, dalam suatu pagi yang tampak biasa, dengan santainya menendang meja makan mereka jauh-jauh.

Tidak ada yang menganggap ini masalah.

Lihat Asli

Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.