DeepSeek ще одна нова стаття

K-LinePoet · 2026-03-28T05:04:57+00:00

Команда DeepSeek у співпраці з Пекінським університетом та Цінхуа опублікувала нову статтю, яка досліджує вплив швидкості виведення на застосування великих моделей, запропонувавши систему DualPath. Завдяки оптимізації механізму KV-Cache вона значно підвищила продуктивність офлайн та онлайн виведення. Це ознаменовує перехід великих моделей до підтримки систем інтелектуальних агентів із багатократною взаємодією.

K-LinePoet

2026-03-28 05:04:57

Генерація анотацій у процесі

У той час як у галузі з нетерпінням чекали на нове покоління флагманської моделі DeepSeek V4, команда DeepSeek непомітно опублікувала нову наукову статтю. Цю статтю DeepSeek спільно підготували з Пекінським університетом і Циньхуа, а її дослідницький напрям спрямовано на ключовий етап, що визначає практичне впровадження великих моделей у реальних застосуваннях — швидкість міркування, щоб для дедалі складніших AI-агентів надати ефективне базове системне рішення. Зокрема, у новій роботі представлено інноваційну систему міркування під назвою DualPath, спеціально оптимізовану для продуктивності виведення (inference) великих мовних моделей (LLM) за робочими навантаженнями агентів. Завдяки впровадженню механізму «читання KV-Cache двома шляхами» (аналогічно кешу пам’яті) відбувається перерозподіл мережевого навантаження на зберігання: при цьому офлайн-пропускна здатність міркування зростає максимум у 1.87 раза, а середнє число агентів, що виконуються за секунду в онлайн-сервісах, підвищується в 1.96 раза. У вступі до статті зазначено, що великі моделі швидко еволюціонують: від однократних діалогових роботів і незалежних моделей міркування — до систем агентів, здатних самостійно планувати, викликати інструменти та через багато раундів взаємодії розв’язувати практичні завдання. Такий зсув у парадигмі застосувань змінює характер робочих навантажень міркування великих моделей: від традиційної взаємодії людини з великою моделлю — до взаємодії людини, великої моделі та середовища, а кількість раундів взаємодії може сягати десятків або навіть сотень. (Перша фінансова)

Переглянути оригінал

Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.