DeepSeek ще одна нова стаття

robot
Генерація анотацій у процесі

У той час як у галузі з нетерпінням чекали на нове покоління флагманської моделі DeepSeek V4, команда DeepSeek непомітно опублікувала нову наукову статтю. Цю статтю DeepSeek спільно підготували з Пекінським університетом і Циньхуа, а її дослідницький напрям спрямовано на ключовий етап, що визначає практичне впровадження великих моделей у реальних застосуваннях — швидкість міркування, щоб для дедалі складніших AI-агентів надати ефективне базове системне рішення. Зокрема, у новій роботі представлено інноваційну систему міркування під назвою DualPath, спеціально оптимізовану для продуктивності виведення (inference) великих мовних моделей (LLM) за робочими навантаженнями агентів. Завдяки впровадженню механізму «читання KV-Cache двома шляхами» (аналогічно кешу пам’яті) відбувається перерозподіл мережевого навантаження на зберігання: при цьому офлайн-пропускна здатність міркування зростає максимум у 1.87 раза, а середнє число агентів, що виконуються за секунду в онлайн-сервісах, підвищується в 1.96 раза. У вступі до статті зазначено, що великі моделі швидко еволюціонують: від однократних діалогових роботів і незалежних моделей міркування — до систем агентів, здатних самостійно планувати, викликати інструменти та через багато раундів взаємодії розв’язувати практичні завдання. Такий зсув у парадигмі застосувань змінює характер робочих навантажень міркування великих моделей: від традиційної взаємодії людини з великою моделлю — до взаємодії людини, великої моделі та середовища, а кількість раундів взаємодії може сягати десятків або навіть сотень. (Перша фінансова)

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити