Kemampuan Agen mengikuti ketat Opus4.6, dengan harga hanya 4%: Arcee merilis Trinity Large Thinking sumber terbuka

robot
Pembuatan abstrak sedang berlangsung

Berdasarkan pemantauan 1M AI News, perusahaan model AI AS Arcee merilis Trinity-Large-Thinking, sebuah model penalaran open source yang ditujukan untuk tugas Agent jangka waktu panjang. Model ini menggunakan arsitektur sparse mixture of experts (MoE), total parameter 400B, dengan parameter aktif hanya 13B, dan tersedia untuk diunduh bobotnya secara terbuka di Hugging Face di bawah lisensi Apache 2.0.

Berbeda dengan Trinity-Large-Preview terdahulu (fine-tuning instruksi murni), Trinity-Large-Thinking melakukan “pemikiran penalaran” terlebih dahulu sebelum menjawab, dengan peningkatan pada panggilan alat multi-babak, koherensi konteks panjang, dan kemampuan mengikuti instruksi. Tujuan desain utamanya adalah mempertahankan keluaran yang stabil dalam loop Agent jangka waktu panjang.

Pada benchmark kemampuan Agent PinchBench yang dikembangkan oleh Kilo, model ini meraih skor 91,9, menempati peringkat kedua, hanya di bawah Opus 4.6 dengan skor 93,3; pada benchmark tugas Agent Tau2-Airline, meraih skor 88,0, tertinggi di antara semua model pembanding. Namun kinerja pada benchmark penalaran umum tergolong biasa: GPQA-D meraih skor 76,3, lebih rendah dari Kimi-K2.5 (86,9) dan Opus 4.6 (89,2); MMLU-Pro meraih skor 83,4, juga berada di posisi terbawah. Menurut pernyataan resmi Arcee, model ini “di banyak dimensi adalah model open source terkuat di luar Tiongkok”.

Harga API Arcee adalah $0,90 per satu juta token keluaran; menurut Arcee, ini sekitar 96% lebih murah dibanding Opus 4.6. Model ini juga diluncurkan bersamaan pada platform perutean model AI OpenRouter, dengan penggunaan gratis di OpenClaw selama 5 hari pertama. Sejak Preview versi sebelumnya dirilis pada akhir Januari, ia telah melayani lebih dari 3,37 triliun token di OpenRouter. Preview adalah model open source dengan penggunaan AS nomor 1 dan global nomor 4 yang terdaftar di OpenClaw; Preview akan terus tersedia gratis di OpenRouter.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan