OpenRouter запуск кешування відповідей: однакові запити — безкоштовно, затримка з секундної знизилася до мілісекунд

robot
Генерація анотацій у процесі
Біржова мережа повідомляє, що OpenRouter запустив функцію кешування відповідей (response caching), розробники можуть активувати її, додавши в заголовок запиту x-openrouter-cache: true. Перший виклик проходить через постачальника з відповідною оплатою, а всі подальші однакові запити повертають кешований результат без додаткових витрат на токени. Після попадання в кеш час відповіді становить від 80 до 300 мілісекунд, середній час запиту — 4 мілісекунди. Без кешу, середній час відповіді Gemini 2.5 Flash — приблизно 1,3 секунди, Kimi K2.6 — близько 4,6 секунди, GPT-5.5 — приблизно 9,1 секунди. Ця функція відрізняється від кешування prompt постачальника тим, що кешування відповіді повністю пропускає постачальника і повертає повну відповідь безпосередньо з кешу на краю OpenRouter. Можна кешувати текст, зображення, аудіо, документи та виклики інструментів, що охоплює чотири кінцеві точки. Кешування ізольоване за API ключами, TTL за замовчуванням становить 5 хвилин, але його можна налаштувати від 1 секунди до 24 годин.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено