P95 затримка знизилася на 91% Яке це поняття? Раніше потрібно було чекати десять секунд, а тепер — миттєво.

Переглянути оригінал
MeNews
Mem0 опублікував дослідження архітектури довготривалої пам’яті: точність на 26% вища за OpenAI, затримка при виведенні зменшена на 91%
Mem0 опублікував дослідження основного алгоритму довготривалої пам’яті: за допомогою двоступеневого конвеєра витягує ключові факти та оновлює пам’ять, уникаючи забудькуватості. На базі бенчмарку LOCOMO точність перевищує вбудовану пам’ять OpenAI на 26%, затримка для P95 зменшилась на 91%, споживання токенів — на 90%. Посилена версія Mem0ᵍ із введенням графової бази даних захоплює міжсесійні зв’язки між об’єктами. На виробництві час від пошуку у пам’яті до відповіді становить лише 0,71 секунди, що значно швидше ніж майже 10 секунд для повного контексту. Дослідження вже подано на ECAI, а код відкрито на GitHub.
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено