Сотні карт можуть витримати потік відвідувачів. Якщо ця технологія оптимізації стане відкритою, скільки бюджету на обчислення зможуть заощадити малі та середні підприємства?

Переглянути оригінал
CoinNetwork
币界网 повідомляє, що OpenAI нещодавно знайшла оптимізаційне рішення, яке дозволяє скоротити витрати на виведення (інференцію) моделі більш ніж удвічі. За словами одного з обізнаних джерел, інженери OpenAI на початку цього місяця повідомили деяким колегам, що завдяки кільком новим оптимізаційним технологіям, які вони розробили, їм вдалося зменшити необхідну кількість графічних процесорів (GPU) NVIDIA лише до кількох сотень, особливо після застосування цієї технології в сценаріях використання ChatGPT відвідувачами без безкоштовних або платних облікових записів.
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено