Mem0 merilis penelitian arsitektur memori jangka panjang: akurasi unggul 26% dari OpenAI, penundaan inferensi berkurang 91%

robot
Pembuatan abstrak sedang berlangsung
ME News Berita, 17 April (UTC+8), menurut pemantauan Beating dari Dongcha, platform memori AI personalisasi Mem0 baru-baru ini mengumumkan hasil penelitian algoritma memori jangka panjang inti mereka. Data eksperimen menunjukkan bahwa dalam pengujian standar LOCOMO, tingkat akurasi respons Mem0 26% lebih tinggi daripada fungsi memori bawaan OpenAI, dan karena mekanisme pencarian "faktualisasi" nya, latensi inferensi P95 menurun sebesar 91%, dan konsumsi Token berkurang sebesar 90%. Algoritma ini menyelesaikan masalah utama yaitu fenomena "lupa" pada agen AI selama interaksi jangka panjang. Berbeda dengan pendekatan kasar memperbesar jendela konteks LLM secara langsung, Mem0 menggunakan pipeline proses dua tahap: pada "tahap ekstraksi", sistem mengekstrak fakta penting dari percakapan terbaru, ringkasan bergulir, dan riwayat; pada "tahap pembaruan", sistem membandingkan dengan basis data vektor, melakukan operasi penambahan, pembaruan, penghapusan konflik, atau pengabaian, untuk memastikan basis memori tetap ringkas dan konsisten. Penelitian ini juga memperkenalkan varian peningkatan, Mem0ᵍ. Versi ini memperkenalkan struktur basis data graf, mengubah fakta yang diekstrak menjadi node dan edge berlabel, sehingga dapat menangkap hubungan entitas yang kompleks antar percakapan. Dalam lingkungan produksi nyata, Mem0 dapat menyelesaikan seluruh proses dari pencarian memori hingga pembuatan jawaban dalam waktu 0,71 detik, sementara metode "konteks penuh" tradisional membutuhkan hampir 10 detik. Saat ini, penelitian ini telah diterima oleh Konferensi Kecerdasan Buatan Eropa (ECAI), dan kode terkait telah dirilis secara open source di GitHub. (Sumber: BlockBeats)
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • 7
  • 8
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
NightFlightMint
· 3jam yang lalu
Apakah tahap pertama dalam mengekstraksi fakta kunci akan kehilangan informasi?
Lihat AsliBalas0
ApeWithNotes
· 3jam yang lalu
Dari lupa menjadi memori jangka panjang, titik permasalahan ini ditangkap dengan tepat
Lihat AsliBalas0
BorrowingBuddy
· 3jam yang lalu
P95 penundaan turun 91%, optimisasi ekor panjang lebih sulit daripada rata-rata penundaan
Lihat AsliBalas0
GateUser-f78f1f3e
· 3jam yang lalu
Pengambilan memori dalam 0,71 detik, apakah lingkungan produksi mampu menahan beban tinggi secara bersamaan?
Lihat AsliBalas0
MintColdBrew
· 3jam yang lalu
Menggunakan basis data graf untuk hubungan entitas antar sesi, arah peningkatan ini sangat cerdas
Lihat AsliBalas0
NightFlightPaperCrane
· 3jam yang lalu
Memori bawaan OpenAI memang kurang berguna, akhirnya ada yang serius mengerjakannya
Lihat AsliBalas0
GateUser-4bd1cc87
· 3jam yang lalu
Apa saja skenario pengujian spesifik di mana LOCOMO benchmark 26% lebih tinggi dari OpenAI?
Lihat AsliBalas0
  • Disematkan