NVIDIA lanza Gamma-World, un modelo de mundo multi-agente que soporta colaboración de cuatro personas y 24 FPS en tiempo real

robot
Generación de resúmenes en curso
ME AI Mensaje, según la monitorización de Beating, investigadores de NVIDIA en colaboración con la Universidad de Tsinghua, la Universidad de Toronto y el Instituto Vector han publicado Gamma-World, un modelo de mundo generativo multiagente que rompe la limitación de los entornos virtuales que tradicionalmente se restringían a interacciones de uno o dos jugadores. El equipo ha lanzado actualmente la página del proyecto y el artículo, y el código y los pesos se abrirán próximamente. El modelo introduce mecanismos de expansión en alta dimensión de la codificación de posición rotatoria y de marcado de intermediarios de información, garantizando que múltiples jugadores puedan ser controlados de forma independiente y logrando, por primera vez, la transferencia directa de un modelo de doble jugador a colaboración de cuatro jugadores sin necesidad de reentrenamiento. El principal desafío del modelo de mundo multiagente es mantener el control independiente de cada jugador y evitar conflictos en sus acciones. El equipo de investigación diseñó la codificación de agente rotatorio simplex (Simplex Rotary Agent Encoding), que lleva la clásica codificación de posición rotatoria (RoPE) a un espacio angular de alta dimensión. Este nuevo método de codificación permite que todos los jugadores tengan simetría física completamente equivalente, sin depender de números de jugador fijos, logrando una referencia y control independientes más naturales. Para evitar que el aumento en el número de jugadores cause un crecimiento cuadrático en el cálculo, se introdujo un mecanismo de atención central dispersa (Sparse Hub Attention). El sistema transmite información de interacción mediante marcas centrales aprendibles, comprimiendo con éxito el coste de atención entre jugadores a un nivel lineal. En cuanto a la velocidad de generación, el equipo distiló un modelo difuso de alta latencia en un modelo causal de menor latencia, y junto con la caché de claves y valores (KV Cache), lograron una respuesta en tiempo real de 24 cuadros por segundo (24 FPS). Las evaluaciones en entornos de juegos multijugador muestran que el nuevo modelo supera claramente a las redes tradicionales de atención dispersa y de ranura en términos de realismo visual, control de respuesta de acciones y coherencia entre jugadores. (Fuente: BlockBeats)
Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • 8
  • 2
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
GateUser-b74aba1c
· hace5h
La atención Sparse Hub Attention reduce el costo a lineal, finalmente ya no es necesario mirar presentaciones.
Ver originalResponder0
MemeFisher
· hace6h
Caché KV + destilación de profesores, la optimización del proyecto está al máximo
Ver originalResponder0
GlassDomeObservatory
· hace6h
El control de la pantalla es superior a la red tradicional, y el modelo mundial generativo se convertirá en uno.
Ver originalResponder0
LiquidityLibrarian
· hace6h
Después de verlo, quiero reproducirlo, pero me falta la tarjeta.
Ver originalResponder0
ArbiterOfFees
· hace7h
Nvidia esta vez está apostando por un mundo de juegos generado por IA.
Ver originalResponder0
ProofOfVibes
· hace7h
Es fundamental que cada jugador controle de manera independiente este punto, muchas soluciones anteriores no lograron hacerlo.
Ver originalResponder0
MarginMarmot
· hace7h
De dos a cuatro personas directamente, el nuevo campo de batalla de la Ley de Escalamiento
Ver originalResponder0
SentimentIndicatorHarvester
· hace7h
Redes tradicionales: ¿son ustedes corteses?
Ver originalResponder0
  • Fijado