🔥Ramp Labs запустила рішення для спільного збереження пам’яті багатьох агентів — Latent Briefing, при цьому максимальне споживання токенів знизилось на 65%


11 квітня компанія з інфраструктури штучного інтелекту Ramp Labs опублікувала дослідження «Latent Briefing», яке реалізує ефективне спільне збереження пам’яті між системами багатьох агентів шляхом безпосереднього стиснення кешу KV великих моделей, значно зменшуючи споживання токенів без втрати точності. У провідних архітектурах багатьох агентів координатор (Orchestrator) розбиває завдання і багаторазово викликає модель виконавця (Worker), і з розширенням ланцюга розуміння кількість токенів зростає експоненціально. Основна ідея Latent Briefing полягає в тому, щоб за допомогою механізму уваги ідентифікувати…
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити