Dasar
Spot
Perdagangkan kripto dengan bebas
Perdagangan Margin
Perbesar keuntungan Anda dengan leverage
Konversi & Investasi Otomatis
0 Fees
Perdagangkan dalam ukuran berapa pun tanpa biaya dan tanpa slippage
ETF
Dapatkan eksposur ke posisi leverage dengan mudah
Perdagangan Pre-Market
Perdagangkan token baru sebelum listing
Futures
Akses ribuan kontrak perpetual
CFD
Emas
Satu platform aset tradisional global
Opsi
Hot
Perdagangkan Opsi Vanilla ala Eropa
Akun Terpadu
Memaksimalkan efisiensi modal Anda
Perdagangan Demo
Pengantar tentang Perdagangan Futures
Bersiap untuk perdagangan futures Anda
Acara Futures
Gabung acara & dapatkan hadiah
Perdagangan Demo
Gunakan dana virtual untuk merasakan perdagangan bebas risiko
Peluncuran
CandyDrop
Koleksi permen untuk mendapatkan airdrop
Launchpool
Staking cepat, dapatkan token baru yang potensial
HODLer Airdrop
Pegang GT dan dapatkan airdrop besar secara gratis
IPO Access
Buka akses penuh ke IPO saham global
Poin Alpha
Perdagangkan aset on-chain, raih airdrop
Poin Futures
Dapatkan poin futures dan klaim hadiah airdrop
Investasi
Simple Earn
Dapatkan bunga dengan token yang menganggur
Investasi Otomatis
Investasi otomatis secara teratur
Investasi Ganda
Keuntungan dari volatilitas pasar
Soft Staking
Dapatkan hadiah dengan staking fleksibel
Pinjaman Kripto
0 Fees
Menjaminkan satu kripto untuk meminjam kripto lainnya
Pusat Peminjaman
Hub Peminjaman Terpadu
Promosi
AI
Gate AI
Partner AI serbaguna untuk Anda
Gate AI Bot
Gunakan Gate AI langsung di aplikasi sosial Anda
GateClaw
Gate Blue Lobster, langsung pakai
Gate for AI Agent
Infrastruktur AI, Gate MCP, Skills, dan CLI
Gate Skills Hub
10RB+ Skills
Dari kantor hingga trading, satu platform keterampilan membuat AI jadi lebih mudah digunakan
GateRouter
Pilih secara cerdas dari 40+ model AI, dengan 0% biaya tambahan
Setelah AI menelan segalanya, apa lagi yang tidak dapat dilatih?
Catatan editor: Ketika kemampuan AI terus melonjak, dalam dunia investasi muncul sebuah sikap pesimis baru: jika model semakin kuat, semua perusahaan aplikasi akhirnya akan ditelan oleh model dan kekuatan komputasi dari Anthropic, OpenAI, Nvidia, dan sejenisnya, pasar akhirnya hanya akan menyisakan model terdepan, kekuatan komputasi, dan sedikit infrastruktur. Tapi Sarah Guo berpendapat, penilaian ini hanya setengah benar. Mereka yang menggunakan "thin wrapper" (bungkus tipis, yaitu aplikasi yang hanya memakai model sebagai lapisan luar sederhana) memang akan diserap, tugas-tugas yang bisa diukur dengan benchmark, dilatih dengan data terbuka, dan diverifikasi dengan biaya rendah, juga akan secara bertahap menjadi komoditas.
Masalah sebenarnya adalah: setelah AI menelan semua yang bisa dilatih, apa yang tetap tidak bisa dilatih?
Jawaban dari artikel ini adalah nilai-nilai yang ada di dalam organisasi nyata, yang tidak bisa dengan mudah diduplikasi dari luar: data perusahaan yang bersifat pribadi, alur kerja yang kompleks, kepercayaan pengguna, hak akses sistem, penilaian industri, tanggung jawab kepatuhan, serta pengalaman yang terkumpul selama operasi jangka panjang. Model bisa menjadi lebih cerdas, tetapi tidak otomatis bisa masuk ke sistem produksi bank; bisa menghasilkan jawaban medis, tetapi tidak langsung mendapatkan kepercayaan dokter dan proses pengambilan keputusan rumah sakit; bisa menulis teks hukum, tetapi tidak bisa menanggung tanggung jawab sebagai pengacara senior, dan tidak bisa mendefinisikan apa yang merupakan pekerjaan hukum yang layak dari nol.
Oleh karena itu, perusahaan AI yang benar-benar memiliki keunggulan kompetitif di masa depan bukan sekadar lebih cerdas dari model umum, tetapi masuk ke dalam industri tertentu dan menyelesaikan pekerjaan "terjemahan" yang sulit namun penting: mengubah realitas pribadi, alat, proses, dan standar penilaian pelanggan menjadi sistem yang dapat dioperasikan model, dan secara bertahap mendefinisikan "hasil yang baik" selama layanan jangka panjang. Semakin kuat AI, semakin menurunkan nilai tugas yang dapat diukur dan diduplikasi; dan semakin menonjolkan "yang tidak bisa dilatih" yang mengandung sejarah, hubungan, hak akses, dan penilaian profesional. Inilah nilai sejati yang tetap bisa dipertahankan setelah model menelan segalanya.
Berikut teks aslinya:
Pada pertengahan 2026, versi "kegilaan AI" para investor adalah sebuah keputusasaan bahwa tidak ada lagi yang layak untuk diinvestasikan: kita seharusnya menginvestasikan semua uang ke Anthropic dan Nvidia, lalu pulang dan tidur. Tapi saya sendiri tidak pernah merasa seperti itu. Sejak beberapa versi kecil sebelumnya, saya yakin model sudah lebih pintar dari saya; jika membeli saham Anthropic dan Nvidia sesuai harga pasar, saya akan sangat senang; teman-teman paling cerdas di sekitar saya juga yakin bahwa model akan dengan cepat memperbaiki dirinya sendiri—tapi saya tetap tidak merasa putus asa.
Keputusasaan ini tidak bodoh. Logikanya seperti ini: jika model terus menguat di semua bidang, maka semua perusahaan yang dibangun di atas model hanyalah lapisan tipis yang menunggu untuk diserap oleh model tersebut; nilai yang tersisa hanyalah kekuatan komputasi dan bobot model terdepan.
Contohnya dalam perangkat lunak, ini adalah kasus yang paling bergantung pada keputusasaan ini. Ketika Devin merilis model pada 2024, model tersebut hanya mampu menyelesaikan 13% tugas dalam benchmark standar perangkat lunak, sehingga secara umum diabaikan pasar. Satu setengah tahun kemudian, agen terkuat mampu mencapai lebih dari 80% skor tinggi dan mulai menangani pekerjaan nyata di Goldman Sachs dan militer AS. Hampir semua orang menarik kesimpulan yang sama: model menelan habis rekayasa perangkat lunak.
Namun, setelah model menelan bagian paling mudah diukur dari rekayasa perangkat lunak, kita juga menyadari kembali satu hal yang sudah lama diketahui banyak tim: rekayasa perangkat lunak memang selalu menolak pengukuran, dan bagian yang paling mudah diukur belum tentu adalah bagian yang paling penting.
Mert Demirer dari MIT dan rekan-rekannya akhirnya mengkuantifikasi hal ini: dari lebih dari 100.000 pengembang, generasi terbaru agen pengkodean meningkatkan jumlah kode yang dibuat sekitar 180%, tetapi jumlah kode yang benar-benar dirilis ke produksi hanya meningkat sekitar 30%. Menulis kode menjadi lebih murah, tetapi proses-proses lain tetap memerlukan manusia, dan proses ini sangat penting. Tentu saja, dampak bersih secara keseluruhan tetap luar biasa.
Benchmark adalah sesuatu yang bisa diukur; dan apa pun yang bisa diukur, bisa digunakan untuk pelatihan. Oleh karena itu, agen pengkodean menjadi yang paling matang terlebih dahulu: compiler adalah validator gratis, dan rangkaian pengujian juga validator gratis. Ketika jawaban bisa diperiksa sendiri dengan biaya hampir nol, kita bisa terus mengasah proses ini sampai benar-benar sempurna.
Namun, melakukan pengujian tidak pernah berarti bahwa perubahan tersebut benar untuk kode yang sudah berjalan selama sepuluh tahun. Mungkin ada tiga alasan yang tidak tertulis di dokumentasi mengapa modul tersebut ada; pipeline deployment mungkin bergantung pada cron job yang dipaksakan dipertahankan oleh satu orang yang tidak mau mengakuinya.
Keabsahan ini tidak bisa dibaca dari peringkat, bahkan tidak bisa langsung dibaca dari apapun. Anda hanya bisa membiarkan sistem yang sangat kompleks ini berjalan cukup lama di dunia nyata untuk mengetahui apakah benar-benar efektif. Dan model yang lebih cerdas tidak akan membuat dunia nyata berjalan lebih cepat. Tidak ada yang akan merasa tenang jika Google harus menjalankan semua pengujian unit dan melihat centang hijau sebelum percaya sepenuhnya. Kepercayaan itu datang karena sistem tersebut sudah menanggung beban selama bertahun-tahun.
Keabsahan ini tidak hanya bersifat pribadi, tetapi juga merupakan sebuah keunggulan kompetitif yang terbentuk secara perlahan—sebuah keunggulan yang tidak bisa dipercepat oleh modal. Bahkan para optimis pun mengakui bahwa jam ini tidak bisa dilompati. Noam Brown dari OpenAI yang mempelopori model inferensi baru-baru ini menulis: satu-satunya cara yang paling dapat diandalkan untuk menilai performa agen selama satu tahun adalah dengan membiarkannya berjalan selama satu tahun penuh.
Seperti yang dikatakan Gabe Pereyra, otomatisasi sejati bukan hanya tentang model yang lebih kuat. Ia adalah perubahan yang terjadi secara bersamaan pada produk, model, alur kerja, dan organisasi perusahaan—dan dari keempatnya, tiga berjalan sesuai kecepatan organisasi.
Hal yang membuat orang tetap bergerak adalah bagian yang tidak bisa dijangkau oleh benchmark: meyakinkan mitra yang skeptis untuk mengubah cara mereka mengelola urusan; menjaga kohesi tim selama proses rekonstruksi. Itulah sebabnya saat merekrut CEO, kita menilai kemampuan mereka dalam berinteraksi manusia, tidak kurang dari kemampuan analisis. Model yang lebih pintar tidak akan mengubah bobot ini.
Umpan balik di sini bersifat kabur, dan rentang waktunya tahunan, serta kepercayaan bergantung pada orang tertentu. Saya kenal setiap perusahaan yang sudah membuat setiap insinyur mereka memakai model pengkodean terdepan, tetapi tidak ada satu pun organisasi engineering yang berubah secepat kemajuan model. Mengadopsi alat hanya memakan waktu satu kuartal—dan itu adalah kuartal yang sangat menakjubkan untuk pertumbuhan token! Tapi rekonstruksi yang sesungguhnya membutuhkan bertahun-tahun.
Pekerjaan yang bisa dilihat secara jelas sedang meninggalkan tempatnya. Pekerjaan yang benar-benar berharga secara struktural adalah pekerjaan yang tidak bisa dibaca: apa pun yang bisa dimasukkan ke dalam peringkat bisa digunakan untuk pelatihan; dan karena itu, apa pun yang bisa diukur sedang menuju ke arah komodifikasi. Proses ini membutuhkan waktu, dan tidak akan pernah benar-benar selesai, tetapi arahnya tidak akan pernah berbalik.
Menurut teman saya, Matt MacInnis dari Rippling, jika diungkapkan dalam bahasa uang: satu token yang hanya digunakan untuk menjawab pertanyaan umum hampir tidak berharga, karena model siapa pun bisa menjawabnya; tetapi jika token tersebut digunakan untuk inferensi berdasarkan data perusahaan Anda, nilainya jauh lebih besar, karena itu melakukan hal yang benar-benar Anda inginkan, bukan sekadar menghasilkan jawaban yang tampak masuk akal.
Pekerjaan yang bisa dibaca akan diserap dari dua arah.
Dari bawah, tugas akan mencapai kejenuhan: begitu sebuah pekerjaan bisa diverifikasi dengan biaya rendah, pembeli tidak lagi peduli model mana yang menyelesaikannya, melainkan berapa biayanya. Maka pekerjaan itu akan dialihkan ke model open-source termurah atau model distilasi yang tersedia minggu itu. Selama margin keuntungan masih bisa dipertahankan, akhirnya hal ini pasti akan terjadi.
Dari atas, laboratorium sedang mencoba agar model menelan sendiri kerangka kerjanya. Routing antara retrieval, panggilan murah dan mahal, penggunaan alat, bahkan strategi inferensi—semua perangkat yang dulu berada di luar model sedang diintegrasikan ke dalam bobot model, sampai "bungkus" itu sendiri menjadi model. Inilah batas penyerapan.
Tekanan keuntungan juga akan berperan dari arah lain: agen umum harus siap menangani segala hal, sehingga biayanya tinggi; sedangkan aplikasi yang fokus dapat mengoptimalkan alur kerja hingga sangat efisien, hanya menggunakan sebagian kecil token. Dan berbeda dengan laboratorium yang menjual token, perusahaan aplikasi bisa menyimpan selisihnya.
Oleh karena itu, kita bisa mengajukan dua pertanyaan untuk setiap jenis pekerjaan: apakah keabsahannya bersifat pribadi dan mahal, dan hanya ada di data internal perusahaan? Apakah pekerjaan itu terisolasi dalam sistem yang tidak bisa diakses orang luar? Jika digabungkan dengan tingkat kejenuhan tugas, akan terbentuk matriks 2×2.
Pekerjaan yang sudah jenuh dan jawabannya terbuka adalah domain token komoditas, yang akan didominasi oleh model open-source. Pekerjaan yang paling depan tetapi jawabannya terbuka, seperti benchmark pengkodean, adalah tempat para laboratorium akan menang karena penilaian gratis, dan memiliki nilai sendiri tidak terlalu penting.
Hadiah sesungguhnya adalah sudut terakhir, yaitu sudut "tidak bisa dilatih": pekerjaan terdepan, tetapi keabsahannya hanya ada di lingkungan pribadi. Anda bisa melihat ini di cloud inferensi yang melayani AI asli: sebagian besar token dihasilkan oleh model kustom, bukan model open-source umum.
Dinding menuju sudut terakhir ini memiliki tinggi dan rendahnya sendiri. Perpustakaan kode pengembang adalah portabel dan standar, jadi tidak sulit untuk masuk ke dalamnya. Tapi sistem produksi bank tidak portabel dan tidak standar. Anda tidak akan mendapatkan hak akses root hanya karena menjadi lebih pintar 2% di SWE-Bench Verified.
Kemampuan akan menelan banyak hal, tetapi model yang lebih baik tidak akan mengubah standar nyata yang bersifat pribadi menjadi standar terbuka. Ia tidak memiliki lisensi, tidak menandatangani tanggung jawab, dan tidak memiliki dokumen perusahaan; ketika jawaban salah, ia juga tidak bisa digugat. Batasan di sini bukan kecerdasan, melainkan hak akses dan tanggung jawab. Anda bisa membayangkan model yang jauh lebih pintar dari manusia, tetapi tetap harus diizinkan masuk dan ada orang yang bertanggung jawab atas apa yang dilakukan model tersebut.
Pintu ini terkunci dan dipasangi pengait.
Kunci tersebut adalah lingkungan: hanya setelah mendapatkan kepercayaan di dalam sistem, melalui audit keamanan, integrasi lengkap, dan penandatanganan kontrak yang bertanggung jawab atas hasilnya, Anda bisa memverifikasi apakah AI benar-benar melakukan hal yang berguna.
Pengait pintu adalah pengguna. Saat ini, sebagian besar dokter di AS setiap hari membuka OpenEvidence—yang tidak bisa dibeli oleh kekuatan komputasi apa pun. Sebuah laboratorium bisa melatih model medis yang sempurna besok, tetapi mereka tetap tidak bisa masuk ke kebiasaan dokter dan proses pengambilan keputusan di UCSF. Karena kepercayaan dibangun secara perlahan, melalui hubungan dan izin pengguna, bukan melalui gradient descent yang menghapus semua itu.
Ini juga pekerjaan perusahaan aplikasi. Sebuah aplikasi yang mampu bertahan di sudut "tidak bisa dilatih" bergantung pada pekerjaan-pekerjaan yang tidak glamor: mengatur realitas pribadi perusahaan agar model bisa bertindak berdasarkan data tersebut; memberikan alat kepada model; dan bekerja sama dengan pelanggan untuk mengubah cara kerja tenaga kerja mereka.
Perusahaan yang mampu melakukan "terjemahan" semacam ini sangat sulit diduplikasi, dan proses terjemahan ini tidak akan pernah selesai. Integrasi dan pemeliharaan akan berlangsung terus selama hubungan dengan pelanggan. Yang menang adalah tim yang menempatkan insinyur dan alat khusus ke dalam lingkungan pelanggan.
Contohnya, di sebuah firma hukum besar dan bersejarah, setiap tahun ada hampir seribu transaksi merger dan akuisisi. Anda tidak bisa membiarkan ratusan asisten pengacara mengunduh dokumen klien ke desktop lalu menyerahkannya ke agen umum untuk dibaca. Masalah kerahasiaan sudah melarang hal itu, apalagi ada puluhan masalah lain. Bahkan jika bisa, apa yang dipelajari hanyalah fragmen: satu asisten memperbaiki satu hal sekali, dan tidak ada yang bisa melihat bagaimana seluruh transaksi mengalir.
Sinyal yang benar-benar penting berada di tingkat transaksi. Setiap transaksi memiliki bentuknya sendiri: untuk merger dan akuisisi, berupa NDA, daftar klausul, due diligence, perjanjian pembelian, dokumen pelengkap, daftar pengiriman; untuk litigasi kekayaan intelektual, berupa usulan, pengungkapan bukti, teknologi yang ada, dan usulan lainnya. Setiap bidang bisnis memiliki struktur sendiri, dan pengacara serta alatnya tidak bisa sembarangan dipertukarkan.
Tapi masalah utama firma hukum ini ada di tingkat yang lebih tinggi: bagaimana menjalankan semua bidang bisnis secara bersamaan, seperti mitra utama yang mengelola ratusan urusan sekaligus, sambil memperkenalkan sumber kasus baru dan melatih asisten pengacara. Mengubah perusahaan sebesar ini bukanlah tugas yang bisa diselesaikan dengan satu set tugas evaluasi. Ia membutuhkan seorang pengelola yang menangani semuanya seperti "baseball data": targetnya sangat kabur, umpan balik tidak lengkap, siklusnya panjang, dan lingkungan pun tidak statis.
Sayangnya, nilai yang tidak bisa dibaca ini juga sulit dijual—seperti halnya ketidakmampuannya untuk dikomersialisasi: sebuah perusahaan tidak bisa menilai dari luar apakah AI benar-benar bisa mengubah operasinya seperti yang ditunjukkan benchmark. Oleh karena itu, perusahaan terbaik akan berhenti mencoba membuktikan diri dari luar, dan mulai masuk ke dalam sistem pelanggan, lalu menetapkan harga berdasarkan hasil.
Sierra hanya membebankan biaya saat agen menyelesaikan masalah pelanggan; jika masalah dialihkan ke manusia, ia tidak membebankan biaya. Oleh karena itu, harga menjadi semacam mekanisme evaluasi. Dan ini bisa terjadi karena Sierra memiliki hak untuk mendefinisikan "sudah selesai". Devin dari Cognition melakukan hal yang sama di bidang perangkat lunak, dengan meluncurkan "jaminan performa". Hanya ketika Anda dipercaya masuk ke dalam sistem, Anda berhak memberikan jaminan atas hasilnya.
Bahkan dalam layer layanan token—yang oleh semua orang disebut sebagai barang murni—kinerja AI tidak benar-benar seperti barang. Perusahaan AI asli terbaik akan memusatkan layanan mereka pada satu atau dua penyedia, seperti Baseten atau Fireworks. Karena biaya per token akan terus menuju ke arah komoditas, tetapi keandalan di bawah trafik nyata dan akses stabil ke kekuatan komputasi langka tidak akan menjadi barang. Tempat menyediakan layanan inferensi dan model yang digunakan adalah dua pilihan berbeda. Satu-satunya bagian yang benar-benar seperti barang adalah harga.
Argumen umum yang sering muncul adalah: laboratorium adalah pemasok Anda, mengapa mereka tidak menjual produk pihak pertama mereka di bawah biaya untuk menghancurkan Anda? Atau langsung mencabut akses API Anda dan mengambil alih pasar ini? Itulah versi nyata dari keputusasaan itu. Tapi ini hanya berlaku jika lapisan model adalah permainan satu orang.
Jelas, kenyataannya tidak seperti itu. Lapisan model lebih mirip kompetisi mati-matian antara tiga setengah pemain, dengan beberapa pemain internasional yang tertinggal sekitar enam bulan dalam kemajuan pelatihan, dan sebuah aliansi pengembangan yang skala-nya lima kali lipat dari tahun lalu. Pelanggan ingin agar pemasok mereka bersaing, dan laboratorium ingin merebut pangsa pasar, bukan membunuh satu aplikasi tertentu.
Anda bisa melihat ini di pasar kompetisi langsung antar laboratorium. Dalam skenario percakapan konsumen, model terbaik tidak pernah secara sederhana merebut seluruh pasar. ChatGPT tetap unggul selama bertahun-tahun dalam kompetisi nyata; pangsa yang hilang sekarang mengalir ke Gemini, karena distribusi Android dan pencarian, bukan karena model yang lebih baik. Saat ini, Anthropic dianggap memiliki model terbaik di pasar prediksi dan suasana internet, tetapi hampir tidak menjadi pemain utama dalam percakapan konsumen, melainkan membangun bisnisnya di bidang perusahaan dan pengkodean.
Jika model yang lebih baik pun tidak mampu merebut pengguna dari kompetitornya di aplikasi inti, maka mereka juga tidak akan mudah menembus sistem rekam medis rumah sakit atau sistem tanggung jawab bank melalui integrasi. Saat ini, faktor yang mempengaruhi pilihan produk publik bukan hanya kemampuan pengkodean. Jika lapisan model terdepan tetap padat, maka lapisan aplikasi di atasnya akan tetap bernilai.
Jika sebuah pekerjaan tidak bisa dinilai dari luar, maka harus ada orang di dalam yang memutuskan apa yang disebut jawaban yang baik. Keputusan ini adalah inti dari seluruh permainan. Jika cukup banyak keputusan seperti ini tertulis, maka akan menjadi benchmark. Harvey telah merilis benchmark di bidang hukum, dan Sierra merilis benchmark agen suara. Hak Anda untuk mendefinisikan apa arti "baik" di sebuah bidang adalah karena bidang tersebut sudah menggunakannya. Perusahaan-perusahaan ini memenangkan hak tersebut melalui perjuangan nyata dalam adopsi.
Penilaian yang benar-benar menentukan arus uang adalah bersifat pribadi dan terbentuk secara bertahap di setiap perusahaan: perusahaan ini menerima apa sebagai pekerjaan yang baik dalam urusan tertentu. Dan proses ini jauh dari selesai, karena kedalaman hukum jauh melebihi pengujian terbuka mana pun. OpenEvidence sedang mengumpulkan apa yang menjadi jawaban klinis yang aman.
Semua ini sebenarnya bukan "pengukuran" dalam arti sebenarnya, melainkan tentang penilaian apa yang benar dan apa yang baik. Penilaian-penilaian ini dituliskan sampai menjadi standar yang harus diterima oleh semua orang. Tidak peduli seberapa pintar laboratorium model dasar, mereka tidak bisa secara sembarangan menulis standar ini dari nol, karena posisi ini hanya ada di dalam bidang tertentu.
Kewenangan ini sering kali jatuh pada tempat yang sudah ada. Pengacara senior menulis standar hukum. Yang mendefinisikan jawaban klinis yang aman adalah dokter. "Sudah selesai" berarti apa, ditentukan oleh perusahaan yang sudah memiliki hubungan pelanggan.
Batas penyerapan juga akan terus naik, karena kita akan terus belajar menilai lebih banyak pekerjaan, dan apa yang bisa diukur akan diserap. Dasar yang tidak bisa dilatih akan terus menyusut di bawah kaki mereka yang berada di atasnya, sehingga Anda tidak bisa berhenti di posisi yang bisa dipertahankan. Anda harus terus bergerak ke tempat yang belum bisa dinilai, dan secara terus-menerus meninjau kembali dan menilai risiko.
Dalam tugas yang sempit, dengan data pribadi dan sistem penilaian sendiri, Anda bisa melatih model hingga tingkat terdepan dan mengalahkan model umum di skenario penting; model khusus ini akan menjadi bagian dari keunggulan kompetitif. Sebaliknya, jika Anda bersaing berdasarkan kemampuan model umum, itu adalah perang modal, dan Anda akan kalah dari mereka yang memiliki kekuatan komputasi terbanyak. Ini adalah jebakan yang paling mudah bagi perusahaan yang hanya memiliki akses terbatas dan tugas yang sangat dapat dibaca.
Ketika sebuah perusahaan memutuskan untuk bertahan hidup dengan melatih kemampuan melampaui model terdepan di banyak tugas umum, hasilnya biasanya sudah ditentukan oleh skala pusat data. Akhirnya, bukan munculnya juara independen, melainkan penjualan ke pemain dengan kekuatan komputasi besar.
Semua ini adalah strategi bertahan. Lebih sulit lagi adalah menyerang: pertama, memutuskan apa yang ingin dibangun. Inilah yang selama setahun terakhir saya cari, dan mungkin baru tiga kali saya menemukannya. Model tidak bisa membantu dalam hal ini. Ke mana Anda mengarahkannya, model akan mengikuti; tetapi model tidak bisa memberi tahu apa yang layak diarahkan. Anda tidak bisa membuat benchmark untuk ini, dan karena itu tidak bisa melatihnya.
Itulah sebabnya perusahaan besar tidak akan mengambil alih semuanya: mereka akan menjaga wilayah mereka sendiri, dan hal berikutnya akan datang dari orang yang menemukan kegunaan sebelum orang lain. Mungkin, niat adalah input yang lebih langka daripada kekuatan komputasi.
Keputusasaan ini setengah benar. Lapisan bungkus tipis memang sedang diserap, dan banyak hal yang tampak seperti perusahaan saat ini sebenarnya hanyalah lapisan tipis. Tapi penilaian mereka tentang "apa yang tersisa setelah diserap" salah. Mekanismenya jelas, tetapi tujuannya tidak.
Saya percaya arah ini: kecerdasan akan terus menjadi lebih murah, dan nilai akan terus mengalir ke tempat-tempat yang tidak bisa dijangkau oleh model mana pun. Yang tidak bisa dilatih adalah nilai yang mengandung sejarah.
Jadi, masuk ke salah satu bidang tersebut, melakukan pekerjaan terjemahan yang tidak glamor, lalu mulai mendefinisikan apa yang disebut "baik" di sana. Karena pasti akan ada yang melakukannya. Skor benchmark paling sering dikutip tahun ini sebenarnya adalah peta wilayah yang akan segera kehilangan nilainya, sekaligus sebuah pemberitahuan: memberi tahu orang tertentu bahwa mereka akan kehilangan hak untuk menentukan apa yang disebut "baik".