NVIDIA випустила Gamma-World, багатоагентну модель світу, яка підтримує співпрацю чотирьох осіб та реальний час 24 FPS

robot
Генерація анотацій у процесі
ME AI Повідомлення, згідно з моніторингом Beating, дослідники NVIDIA у співпраці з Університетом Цінхуа, Університетом Торонто та Vector Institute опублікували багатоагентну генеративну світову модель Gamma-World, яка руйнує довготривалі обмеження симуляції віртуального середовища, що раніше були обмежені одно- або дво-учасними взаємодіями. Команда наразі опублікувала сторінку проекту та статтю, а код і ваги планується відкрити найближчим часом. Модель вводить механізми високорівневого розширення ротаційного позиційного кодування та маркування інформаційного посередника, що забезпечує незалежне керування кількома гравцями та вперше реалізує безперервне масштабування з двох гравців до чотирьох у співпраці без повторного навчання. Основною проблемою багатогравецької світової моделі є збереження незалежного керування кожним гравцем та уникнення конфліктів у діях. Дослідницька команда розробила простий ротаційний агентський код (Simplex Rotary Agent Encoding), який підвищує класичне ротаційне позиційне кодування (RoPE) до високорівневого кутового простору. Новий спосіб кодування забезпечує повну фізичну симетрію між усіма гравцями, не залежачи від фіксованих номерів гравців, що дозволяє досягти більш природного незалежного посилання та управління. Щоб уникнути квадратичного зростання обчислювальних витрат із збільшенням кількості гравців, було введено механізм розрідженого централізованого уваги (Sparse Hub Attention). Система передає інформацію про взаємодію через навчені централізовані маркери, успішно зменшуючи обчислювальні витрати уваги між гравцями до лінійного рівня. Щодо швидкості генерації, команда перетворила модель дифузії з високою затримкою у причинну модель-учень за допомогою дистиляції, а також використала кешування ключів і значень (KV Cache), що забезпечує реальний час відповіді у 24 кадри на секунду (24 FPS). Оцінка у багатокористувацькому ігровому середовищі показала, що нова модель значно перевищує традиційні мережі з слотами та щільним увагою за якістю відео, керованістю реакцій та узгодженістю між гравцями. (Джерело: BlockBeats)
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • 8
  • 2
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
GateUser-b74aba1c
· 5год тому
Розріджена увага Hub знизилася до лінійної вартості, нарешті більше не потрібно дивитися презентації.
Переглянути оригіналвідповісти на0
MemeFisher
· 6год тому
KV-кешування + викладання з дистиляцією, максимальна оптимізація проекту
Переглянути оригіналвідповісти на0
GlassDomeObservatory
· 6год тому
Контроль над зображенням перевищує традиційні мережі, генеративна світова модель має стати
Переглянути оригіналвідповісти на0
LiquidityLibrarian
· 6год тому
Після перегляду захотів повторити, але виявив, що бракує картки.
Переглянути оригіналвідповісти на0
ArbiterOfFees
· 7год тому
NVIDIA цим кроком робить ставку на створення ігрового світу за допомогою штучного інтелекту
Переглянути оригіналвідповісти на0
ProofOfVibes
· 7год тому
Кожен гравець незалежно контролює цю точку — це дуже важливо, раніше багато рішень цього не могли зробити.
Переглянути оригіналвідповісти на0
MarginMarmot
· 7год тому
Двоє безпосередньо розширюються до чотирьох, новий бойовий простір Закону масштабування
Переглянути оригіналвідповісти на0
SentimentIndicatorHarvester
· 7год тому
Традиційна мережа: Ви ввічливі?
Переглянути оригіналвідповісти на0
  • Закріплено