Tether AI оголосила про інтеграцію відкритого коду TurboQuant у SDK QVAC 0.12.0. TurboQuant спочатку був запропонований Google Research і може стиснути пам’ять кешу KV, необхідну для роботи великих моделей, до 5 разів, що дозволяє запускати довший контекст, більші документи та довші діалоги на локальних пристроях. Tether заявила, що ця технологія буде застосовуватися до ноутбуків, смартфонів, краєвих пристроїв та децентралізованих AI мереж, і стане частиною їхньої стратегії просування локалізації та децентралізованого AI.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено