Ant Financial Science Zhongguancun Forum Berbicara: Efisiensi Token akan menjadi indikator utama dalam menilai nilai AI tingkat perusahaan

MaticHoleFiller · 2026-04-01T00:58:24+00:00

Kebangkitan agen cerdas otonom seperti OpenClaw menandai pergeseran dari aplikasi AI yang berfokus pada percakapan ke pelaksanaan tugas, namun perusahaan menghadapi tantangan seperti pemborosan daya komputasi dan keamanan serta kepatuhan. Zhang Peng menyatakan di forum bahwa fokus kompetisi AI di masa depan akan beralih ke efisiensi Token, terutama dalam skenario frekuensi tinggi seperti keuangan, mendorong solusi kombinasi model kecil dan besar untuk mengurangi biaya dan meningkatkan efisiensi. Ant Financial Science and Technology meluncurkan model keuangan ringan Ling-DT-Fin-Mini-2.5, yang dirancang untuk mengoptimalkan tugas dengan tingkat konvergensi tinggi dan latensi rendah, menunjukkan tren perkembangan industri yang baru.

MaticHoleFiller

2026-04-01 00:58:24

Pembuatan abstrak sedang berlangsung

Munculnya agen eksekusi otonom yang diwakili oleh OpenClaw sedang meledak, menandai evolusi pesat aplikasi AI dari “interaksi percakapan” menuju “eksekusi tugas”. Sambil perusahaan mempercepat adopsi, mereka juga menghadapi berbagai tantangan seperti pemborosan komputasi dan kepatuhan keamanan. Bagaimana membuat agen benar-benar dapat diterapkan secara masif dan berkelanjutan menjadi topik inti yang sama-sama mendapat perhatian industri.

Pada 26 Maret, dalam Forum Inovasi Pengembangan Industri Masa Depan di Zhongguancun, Zhang Peng, manajer umum Departemen Inovasi Teknologi Model Besar Ant Tech (Ant), mengatakan dalam pidatonya bahwa ledakan OpenClaw akan membawa revolusi paradigma AI tingkat perusahaan, mendorong penerapan model besar di skenario industri dari “kompetisi parameter” menuju “persaingan efektivitas Token.”

Pidato Zhang Peng, manajer umum Departemen Inovasi Teknologi Model Besar Ant Tech, di Forum Zhongguancun

Penyebaran cepat agen seperti OpenClaw mencerminkan permintaan pasar terhadap agen tipe eksekusi otonom, tetapi dalam lingkungan industri nyata, penerapannya menghadapi tantangan yang signifikan: karena kurangnya pemahaman mendalam tentang aturan industri dan proses bisnis, ketika agen menjalankan tugas-tugas kompleks, mereka sering berulang kali memanggil alat, sehingga konsumsi Token jauh lebih tinggi daripada output yang efektif. Menurut informasi, dalam beberapa skenario panggilan frekuensi tinggi, biaya konsumsi Token OpenClaw dapat mencapai puluhan kali bahkan ratusan kali biaya Agent terintegrasi. Pola investasi besar dengan output rendah ini membuatnya menghadapi problem keberlanjutan dalam penerapan skala industri.

“Babak bawah hilir penerapan industri model besar, proposisi inti bukanlah persaingan skala parameter model, melainkan peningkatan berkelanjutan efektivitas Token per unit.” Zhang Peng berpendapat bahwa perusahaan harus menggabungkan skenario dan kebutuhan aktual, memilih solusi AI dengan kombinasi model kecil dan besar, untuk mencapai nilai bisnis yang lebih tinggi dengan biaya komputasi yang lebih rendah.

Sebagai contoh dalam skenario keuangan, bidang ini setiap hari perlu menangani sejumlah besar tugas frekuensi tinggi dengan latensi rendah—seperti identifikasi niat secara cepat, ekstraksi informasi kunci, pengambilan dan pengurutan, dan sebagainya. Tugas-tugas ini memiliki kebutuhan akan konkurensi tinggi, respons cepat, dan akurasi tinggi. Model besar inferensi industri tradisional kuat, tetapi dalam skenario seperti ini ibarat “menggunakan pedang untuk membunuh ayam”—biayanya mahal, responsnya cenderung lambat, dan terjadi pemborosan sumber daya.

“Yang benar-benar dibutuhkan industri adalah solusi AI yang mencapai nilai terbaik dalam hal biaya-manfaat serta kecepatan respons, dengan memastikan profesionalisme, ketelitian, dan kepatuhan.” Zhang Peng menyatakan. Ia berpendapat bahwa model dengan parameter besar tampil lebih baik dalam penalaran kompleks dan analisis mendalam, sedangkan model dengan parameter kecil memiliki latensi lebih rendah dan biaya-manfaat lebih tinggi pada skenario tugas frekuensi tinggi dan tugas-tugas kecil. Industri membutuhkan solusi yang menggabungkan model besar dan kecil agar dapat menyelesaikan masalah skenario nyata dengan lebih efisien dan berbiaya lebih rendah.

Di Forum Zhongguancun, Ant Tech merilis model khusus keuangan skala ringan Ling-DT-Fin-Mini-2.5, yang merupakan model pertama dalam seri model besar Ling DT. Menurut pengenalan, Ling DT Fin Mini 2.5 adalah model MoE skala ringan, berdasarkan arsitektur perhatian linear hibrida terbaru Ling 2.5, yang dioptimalkan untuk skenario tugas keuangan dengan konkurensi tinggi dan latensi rendah. Dengan tetap mempertahankan kedalaman profesional, biaya inferensi dapat ditekan hingga tingkat yang memungkinkan penerapan secara masif. Dibandingkan model umum berkemampuan setara yang menjadi arus utama industri, kecepatan inferensinya cepat 100%, sementara biaya perangkat keras untuk memproses volume tugas yang sama menurun secara signifikan, memberikan nilai nyata bagi lembaga keuangan dalam menekan biaya dan meningkatkan efisiensi.

Faktanya, ketika agen AI mempercepat penetrasi ke skenario inti industri dan menjalankan tugas-tugas nyata, kombinasi model besar dan kecil telah menjadi tren industri. Belakangan ini, OpenAI juga meluncurkan dua model kecil GPT‑5.4 mini dan nano secara bertahap, dengan fokus pada latensi rendah dan biaya-efektivitas tinggi, sebagai mesin utama agen sub-level pada lapisan eksekusi.

Zhang Peng mengatakan bahwa perkembangan teknologi pada akhirnya akan kembali pada tuntutan rasional industri terhadap efisiensi. Dalam kompetisi tahap berikutnya, efektivitas Token akan menjadi indikator inti untuk mengukur nilai AI tingkat perusahaan. Ant Tech akan terus mendalami AGI tingkat perusahaan, serta meluncurkan lebih lanjut Ling DT model besar edisi perusahaan “Bailing” (百灵) dan versi industri-nya, untuk mempercepat penerapan skala agen pada skenario kompleks tingkat perusahaan.

Berita dalam jumlah besar, interpretasi yang akurat, semuanya ada di aplikasi Sina Finance

Lihat Asli

Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.