Модель великого розміру з трильйонами параметрів Meituan відкриває тестування, весь процес навчання виконаний на кластері вітчизняних обчислювальних потужностей.

robot
Генерація анотацій у процесі
AIMPACT повідомлення, 24 квітня (UTC+8), за інформацією з галузі, нова фундаментальна велика модель Meituan LongCat-2.0-Preview вже відкрита для тестування. Загальна кількість параметрів цієї моделі перевищила трильйон, що ставить її в ряд найкращих світових великих моделей.
За словами інсайдерів, нова велика модель V4, випущена DeepSeek того ж дня, має загальну кількість параметрів та кількість активованих параметрів, що практично збігаються з Meituan LongCat-2.0-Preview.
Окрім масштабу параметрів, більший прорив нової фундаментальної великої моделі Meituan полягає в тому, що її навчання та логічний висновок повністю виконані на вітчизняних обчислювальних кластерах.
За словами вищезгаданої особи, кількість обчислювальних карт, використаних Meituan на етапі навчання, становить від 50 000 до 60 000, що є найбільшим завданням з навчання великих моделей, виконаним на вітчизняних обчислювальних потужностях на сьогоднішній день.(Інтерфейс)
(Джерело: BlockBeats)
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено