Meituan випустила нативну мультимодальну велику модель LongCat-Next

LightningPacketLoss · 2026-03-27T08:47:37+00:00

3 березня повідомляється, що Meituan випустила та повністю відкрила вихідний код для багатомодальної великої моделі LongCat-Next та її основних компонентів — дискретного нативного роздільного візуального токенізатора (dNaViT). Ця модель руйнує традиційну архітектуру великих моделей, орієнтовану на «мову», об’єднуючи зображення, голос і текст у спільні дискретні токени. За допомогою чистого підходу «прогнозування наступного токена» (Next Token

LightningPacketLoss

2026-03-27 08:47:37

3 березня 27, новини, Meituan випустила та повністю відкрила вихідний код рідного мультимодального великої моделі LongCat-Next та її ключових компонентів — дискретного рідного роздільного візуального сегментатора (dNaViT). Ця модель ламала традиційну збірну архітектуру великих моделей, зосереджену на “мові”, об’єднуючи зображення, мову та текст у єдину дискретну токен. Завдяки чистій парадигмі “прогнозування наступного токена” (Next Token Prediction, NTP) LongCat-Next надає можливість візуальній та мовній інформації стати “рідною мовою” ШІ.

Переглянути оригінал

Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.