CNFinBench Mempublikasikan Skor Komprehensif Model Bahasa Besar: Model Keuangan Besar Ping An Cina Meraih Posisi Pertama

robot
Pembuatan abstrak sedang berlangsung

Baru-baru ini, model keuangan besar PingAnGPT-Qwen3-32B dari China Ping An berada di peringkat pertama secara keseluruhan dalam daftar terbuka model bahasa besar CNFinBench yang diakui industri. Model yang ikut serta dalam penilaian kali ini memiliki kekuatan tim yang besar dan kompetisi yang ketat, mencakup model sumber terbuka seperti DeepSeek-R1 (671B), Qwen3-235B-A22B, Kimi-K2 (1000B), serta model komersial tertutup terkemuka seperti GPT-4o, Claude-Sonnet 4, Doubao-1.5-pro, yang mewakili tingkat tertinggi industri saat ini. Pencapaian tertinggi dalam penilaian ini juga menandai bahwa kemampuan teknologi Ping An di bidang model keuangan besar telah mencapai tingkat terdepan industri.

CNFinBench adalah standar evaluasi komprehensif model keuangan besar berbahasa Mandarin yang dikembangkan oleh tim Laboratorium Kecerdasan Buatan Nasional Shanghai bekerja sama dengan lembaga otoritatif di bidang keuangan. Ini adalah salah satu platform penilaian kemampuan model keuangan terbesar dan paling diakui di dalam negeri. Dalam penilaian ini, PingAnGPT-Qwen3-32B menunjukkan performa luar biasa dalam berbagai indikator penting seperti penalaran dan perhitungan fakta keuangan, jawaban atas pengetahuan profesional keuangan, kepatuhan dan pengendalian risiko keuangan, menunjukkan kemampuan perhitungan numerik keuangan yang akurat, logika yang ketat, dan penguasaan mendalam terhadap seluruh sistem pengetahuan di bidang keuangan. Khususnya dalam analisis riset investasi dan pengukuran risiko, model ini memiliki nilai aplikasi penting dan keunggulan keamanan yang dapat dikendalikan.

Pihak penilai menyatakan bahwa keberhasilan model ini menempati posisi teratas di CNFinBench menunjukkan kekuatan teknologi Ping An di bidang model keuangan besar. Perlu dicatat bahwa model yang ikut serta dalam penilaian ini hanya memiliki skala parameter sebesar 32B, kurang dari 5% dari DeepSeek-R1 (671B) dan 3,2% dari Kimi-K2 (1000B), namun mampu melampaui performa secara keseluruhan, mencapai terobosan penting dalam efisiensi dan kinerja model. Berkat karakteristik “ringan dan efisien”, model ini telah mendukung 97 skenario bisnis seperti pelaporan klaim asuransi kendaraan, layanan pertanyaan pegawai, pemeriksaan kualitas layanan pelanggan secara real-time, skrip percakapan cerdas, dan audit biaya keuangan grup, serta menyediakan dasar yang kokoh untuk deployment privat dan aplikasi berbasis skenario di masa mendatang.

Diketahui bahwa sistem evaluasi CNFinBench mencakup lima dimensi utama: pengetahuan profesional keuangan, pemahaman dan analisis bisnis keuangan, penalaran dan perhitungan fakta keuangan, kepatuhan dan pengendalian risiko keuangan, serta keamanan internal dan aplikasi keuangan, secara menyeluruh menguji kedalaman profesional, pemahaman bisnis, akurasi perhitungan, kesadaran kepatuhan, dan keamanan model dalam bidang keuangan vertikal.

Pada tiga kuartal pertama tahun 2025, database Ping An telah mengumpulkan data sebesar 30 ribu triliun byte, mencakup hampir 250 juta pelanggan pribadi; dengan pelatihan model besar berbasis data masif, mengumpulkan lebih dari 3,2 triliun teks berkualitas tinggi, 310.000 jam data suara berlabel, dan lebih dari 7,5 miliar gambar. Berbasis data yang melimpah dan didukung oleh teknologi pengembangan dan aplikasi dari perusahaan teknologi, Ping An terus memperluas kedalaman dan luasnya aplikasi skenario, memberdayakan pengalaman keuangan yang lebih baik, pengendalian risiko, pengurangan biaya, dan peningkatan penjualan. Pada Februari 2026, National Intellectual Property Publishing House merilis “Laporan Analisis Paten Industri Teknologi Keuangan 2025” dan “Laporan Analisis Paten Industri Kesehatan dan Medis 2025”, di mana China Ping An kembali meraih posisi teratas dalam jumlah paten di bidang teknologi keuangan dan kesehatan medis tahun 2025, serta memimpin dalam berbagai teknologi inti dan skenario aplikasi kunci.

China Ping An menyatakan bahwa melalui pengembangan kemampuan AI terdepan, mendorong iterasi optimalisasi model, dan memperdalam penerapan skenario, perusahaan terus mengubah keunggulan teknologi menjadi nilai layanan, menyediakan layanan keuangan digital berkualitas tinggi, dan secara berkelanjutan memenuhi harapan masyarakat akan kehidupan yang lebih baik, serta menjalankan janji layanan “nyaman, hemat waktu, dan hemat biaya”, berkontribusi pada pembangunan negara kekuatan keuangan.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
0/400
Tidak ada komentar
  • Sematkan