Un rendimiento de solo el 43% por dólar, ¿por qué el 87% de los jugadores de Polymarket están perdiendo dinero?

null

Título original: Teoría de juegos en Polymarket: las 5 fórmulas probadas en 72 millones de operaciones,autor:Movez(@0xMovez)

Compilación|Odaily Star Daily(@OdailyChina);traductor|Asher(@Asher_ 0210)

En el bulevar de Las Vegas, el rendimiento promedio de las tragamonedas es de aproximadamente 93%; es decir, por cada 1 dólar invertido, en promedio solo se recupera 0.93 dólares; en Polymarket, en cambio, los traders aceptan voluntariamente rendimientos tan bajos como 0.43 dólares, apostando 1 dólar a resultados desconocidos cuyas cuotas son incluso peores que las del casino.

Esto no es una metáfora, sino que está basado en datos reales. El investigador Jonathan Becker analizó todos los mercados ya liquidados en Kalshi, cubriendo 72.10 millones de operaciones con un volumen total de 18.26 mil millones de dólares. Las regularidades que encontró también aplican a Polymarket—el mismo mecanismo, las mismas desviaciones, lo que también significa las mismas oportunidades. Las conclusiones que arrojan los datos son muy directas: aproximadamente el 87% de las carteras de mercados de predicción terminan con pérdidas; pero ese 13% restante no gana por suerte, sino porque domina un conjunto de métodos matemáticos que la mayoría de los traders ni siquiera había llegado a conocer.

En este artículo desglosaremos 5 fórmulas de teoría de juegos que separan a los ganadores de los perdedores. Cada una viene con su principio matemático correspondiente, casos reales y código de Python que se puede ejecutar directamente; algunos traders que ya han utilizado estas metodologías en escenarios reales incluyen:

RN(Dirección de Polymarket: Una bot de trading algorítmico de Polymarket que, basada en el modelo del artículo, implementó más de 6 millones de dólares en beneficio total.

distinct-baguette(Dirección de Polymarket: Mercado UP/DOWN, que rotó 560 dólares en rodamiento hasta 812,000 dólares.

  1. Valor esperado: la fórmula más esencial

En Polymarket, cada operación es, en esencia, un juicio de valor esperado. La mayoría de los traders depende de la intuición, y ese 13% de ganadores toma decisiones con matemáticas. El valor esperado (EV) no mide un único resultado, sino el retorno promedio después de repetir muchas veces, y se usa para determinar si una operación vale la pena.

Como ejemplo de un mercado real, “¿llegará el Bitcoin a 150,000 dólares antes de junio de 2026?” La cotización YES actual es de 12¢, lo que corresponde a una probabilidad implícita del 12% para ese mercado. Si, con base en datos on-chain, el ciclo de halving y entradas de fondos del ETF, se estima que la probabilidad real es de alrededor del 20%, entonces esa operación tiene valor esperado positivo. Con ese cálculo, comprando cada contrato a 12¢, el beneficio promedio a largo plazo puede ser de 8¢; comprando 100 contratos, el costo es de 12 dólares y el beneficio esperado es de 8 dólares, con una tasa de retorno de aproximadamente +66.7%.

Pero los datos muestran que la mayoría de los traders de mercados de predicción no realizan este tipo de cálculo. En una muestra que cubre 72 millones de operaciones, el taker (comprador a precio de mercado) pierde en promedio alrededor de 1.12% por operación, mientras que el maker (quien pone una orden) gana en promedio alrededor de 1.12%. La diferencia entre ambos no está en la información, sino en la paciencia: el maker espera oportunidades de valor esperado positivo; el taker, en cambio, se ve más impulsado a operar por impulso.

  1. Mala fijación de precios: la trampa de los contratos baratos

“Preferencia por lo raro” es uno de los errores más caros en los mercados de predicción. Los traders a menudo sobreestiman sistemáticamente eventos de baja probabilidad y pagan un precio demasiado alto por contratos que parecen baratos. Un contrato con precio de 5¢, teóricamente, debería tener una tasa de acierto del 5%; pero en Kalshi la tasa de acierto real es solo 4.18%, lo que equivale a una desviación de precios de -16.36%. En casos aún más extremos, un contrato de 1¢ debería tener una tasa de acierto del 1%; pero para el taker, la tasa de acierto real es únicamente 0.43%, con una desviación de hasta -57%.

Visto desde la distribución general, el mercado fija precios relativamente con precisión en el rango medio (30¢–70¢), pero presenta desviaciones claras en ambos extremos: para contratos por debajo de 20¢, la tasa de acierto real suele ser menor que la probabilidad implícita por el precio; para contratos por encima de 80¢, la tasa de acierto suele ser mayor que la probabilidad reflejada por el precio.

Dicho de otro modo, la ineficiencia del mercado se concentra principalmente en ambos extremos, y justo esos rangos son donde se concentra más la negociación emocional. Concretamente, hay dos fórmulas:

Fórmula uno: Mala fijación de precios (Mispricing, δ)

La mala fijación de precios se usa para medir la desviación entre la tasa de acierto real del contrato y su probabilidad implícita. Por ejemplo, en un contrato de 5¢, entre todos los mercados ya liquidados, supongamos que hay 100,000 operaciones que se ejecutan a 5¢; de ellas, 4,180 terminan con resultado YES. Entonces la tasa de acierto real es 4.18%, mientras que la probabilidad implícita correspondiente al precio es 5.00%. La diferencia entre ambas es -0.82 puntos porcentuales, y la desviación relativa es de aproximadamente -16.36%. Esto significa que, por cada contrato de 5¢ que se compra, en realidad se está pagando alrededor de un 16.36% de prima.

Fórmula dos: Retorno excedente por operación (Gross Excess Return, rᵢ)

Si la mala fijación de precios refleja la desviación global, entonces el retorno excedente por operación revela la estructura de retorno real de cada operación. Y es precisamente aquí donde se ven con claridad las desviaciones conductuales. Al comprar un contrato de 5¢ hay dos resultados: si el contrato se cumple, el beneficio puede alcanzar +1900% (aprox. 20x de retorno); si no se cumple, hay una pérdida directa del 100%, y los 5¢ invertidos se vuelven cero.

Aquí está la razón por la cual la “preferencia por lo raro” resulta atractiva: una vez que acierta, los retornos son extremadamente altos, fáciles de recordar, amplificar y difundir. Pero en conjunto, su tasa de acierto real es menor que la probabilidad implícita por el precio, y la estructura asimétrica entre “pérdida total” y “retorno extremadamente alto” genera un valor esperado negativo en grandes volúmenes de operaciones. En esencia, es como comprar una lotería sobrevalorada.

Visto desde la distribución general, esta desviación tiene un claro gradiente de precio: cuanto más bajo es el precio del contrato, peor es el retorno. Por ejemplo, como taker, invirtiendo 1 dólar en un contrato de 1¢, en promedio solo se recupera alrededor de 0.43 dólares; mientras que en un contrato de 90¢, invirtiendo 1 dólar, en promedio se puede obtener alrededor de 1.02 dólares. Cuanto más barato está el precio, más desfavorables son las condiciones reales de negociación.

Al dividir los roles de forma más detallada, se observa que esta estructura es casi una relación de espejo: las pérdidas del taker en el rango de precios bajos (hasta -57% como mínimo) corresponden de forma equivalente a las ganancias del maker en ese mismo rango; la desviación de precios del mercado en total se ubica entre ambos. En otras palabras, por cada centavo que pierde el taker, casi todo va a manos del maker.

Desde el punto de vista de la teoría de juegos, los contratos de baja probabilidad suelen sobreestimarse sistemáticamente, y los contratos de alta probabilidad a menudo se subestiman. La estrategia real no consiste en perseguir lo raro, sino en vender lo raro y comprar alta certeza.

  1. Fórmula de Kelly: ¿cuánto apostar?

Cuando se detecta una operación con valor esperado positivo, la pregunta real recién empieza: ¿cuánto debe apostar el trader? Si el tamaño de la posición es demasiado grande, una sola pérdida podría borrar ganancias de semanas; si la posición es demasiado pequeña, aunque exista ventaja, la velocidad de crecimiento sería tan lenta que casi no tendría sentido. Entre “apostar todo” y “no apostar nada” existe una proporción de apuesta matemáticamente óptima, y esa es la fórmula de Kelly.

La fórmula de Kelly fue propuesta por John Kelly Jr. en 1956. Al principio se usó para optimizar problemas de señales de comunicación con ruido; después se demostró que es una de las formas más efectivas de gestión de posiciones para apuestas, trading e incluso mercados de predicción. Jugadores profesionales de póker, expertos en apuestas deportivas y fondos cuantitativos de Wall Street casi todos usan alguna forma de estrategia de Kelly.

En mercados de predicción, debido a que los contratos son de estructura binaria (resultado $1 o $0) y el precio en sí representa la probabilidad, la aplicación de la fórmula de Kelly es aún más directa. El punto clave es entender las cuotas (b): si compras un contrato YES de 30¢, en realidad estás usando 0.30 dólares para apostar a una ganancia de 0.70 dólares, lo que equivale a cuotas de 0.70 / 0.30 ≈ 2.33; si el precio es 50¢, las cuotas son 1; si es 10¢, las cuotas son 9; si es 80¢, las cuotas son solo 0.25. Cuanto más altas son las cuotas, más grande es la proporción recomendada por Kelly bajo la premisa de que existe ventaja.

Pero un principio clave es no usar Kelly completo. Aunque matemáticamente el Kelly completo puede maximizar la tasa de crecimiento del capital a largo plazo, en la práctica su volatilidad es enorme y las caídas (drawdown) suelen superar el 50%. Quizá en ciclos largos sea la mejor en rendimiento, pero la volatilidad extrema en el intermedio hace que la mayoría no pueda sostenerse. Por eso, es más común usar Kelly fraccionario (por ejemplo, 1/2 o 1/4 Kelly). Por ejemplo, bajo condiciones estables de tasa de acierto, el Kelly completo finaliza con la curva de capital más alta pero con una volatilidad fuerte; el Kelly 1/4 hace que el crecimiento sea más suave y las caídas sean controlables; el Kelly 1/2 está entre ambos.

En esencia, la fórmula de Kelly proporciona un conjunto de disciplina: primero determinar si existe ventaja (es decir, que tu probabilidad subjetiva es mayor que la probabilidad implícita del mercado), y luego decidir cuánto capital invertir. Solo cuando “si apostar” y “cuánto apostar” están simultáneamente limitados por matemáticas, el trading pasa realmente de ser una simple jugada de teoría a ser una estrategia.

  1. Actualización bayesiana: cambiar de idea como un experto

La razón por la que los mercados de predicción fluctúan es, en esencia, que entra nueva información constantemente. La clave no está en si el juicio inicial fue correcto, sino en cómo ajustar el entendimiento cuando cambian las evidencias. La mayoría de los traders ignoran la nueva información o reaccionan en exceso, mientras que la actualización bayesiana ofrece un método matemático para ajustar “cuánto” es razonable.

La lógica central puede entenderse de forma simple como: nuevo juicio = grado de apoyo de la evidencia a la hipótesis previa × juicio previo ÷ probabilidad total de que ocurra esa evidencia. En aplicaciones reales, normalmente se desarrolla mediante la fórmula de probabilidad total para obtener una forma más conveniente para calcular.

Con un mercado típico como ejemplo, “¿bajará la tasa de interés con recorte en la reunión de junio de la Reserva Federal?” El precio actual del mercado es 35¢, correspondiente a una probabilidad del 35%, como juicio inicial. Luego se publican datos del empleo no agrícola (non-farm): el empleo añadido es solo 120,000 (esperado 200,000), el desempleo sube y el ritmo de crecimiento salarial se desacelera. En este caso, si la Reserva Federal efectivamente bajará la tasa, es más probable que aparezcan esos datos débiles del empleo; esa probabilidad puede estimarse en 70%. Si no bajará la tasa, la probabilidad de que aparezcan este tipo de datos es más baja, pero aún existe; puede estimarse en 25%.

Al aplicar la actualización bayesiana, la nueva probabilidad queda alrededor de 60.1%, es decir, se ajusta de 35% a 60.1% de una sola vez, con una mejora de aproximadamente 25 puntos porcentuales. Esto significa que una sola pieza de información clave es suficiente para cambiar significativamente el juicio del mercado.

En la práctica, no hace falta calcular completamente la fórmula cada vez. Un método más común es la “razón de verosimilitud” (likelihood ratio). Con la misma información (por ejemplo, LR = 3), el efecto no es igual bajo distintos juicios iniciales: partiendo de 10%, podría subir a alrededor de 25%; partiendo de 50%, podría subir a 75%; y partiendo de 90%, solo podría subir hasta 96%. Cuanto mayor es la incertidumbre, mayor es el impacto de la información.

Los traders que superan consistentemente al mercado de predicción a largo plazo no necesariamente son los que “aciertan” más en sus juicios, sino los que ajustan su juicio con la mayor rapidez y de manera más racional cuando aparecen nuevas evidencias. El método bayesiano, en esencia, proporciona esa “escala de velocidad de ajuste”.

  1. Equilibrio de Nash: “la fórmula del póker” en los mercados de predicción

En el póker, el farol nunca es un acto impulsivo, sino una estrategia que puede calcularse con precisión. Teóricamente existe una frecuencia óptima de faroleo; si te desvías, los oponentes expertos pueden aprovecharlo. La misma lógica se aplica a los mercados de predicción. En Polymarket, el “farol” corresponde a operar en contra de la tendencia: cuando el mercado tiene una desviación en la fijación de precios, eliges posicionarte en el lado opuesto al de la mayoría; y “retirarse” (fold), es como un taker pasivo que, de manera continua, paga una prima por el sentimiento del mercado.

En Polymarket, maker y taker constituyen una relación de enfrentamiento similar. Operar en contra (oponiéndose al consenso del mercado) es como “farolear”; operar a favor (siguiendo el juicio dominante) es como “apostar por valor”. Desde la perspectiva del equilibrio, el mercado debería mantener indiferentes a los participantes marginales entre “ser maker” y “ser taker”; ese estado corresponde al equilibrio de Nash en los mercados de predicción.

Pero este equilibrio no es fijo; se ajusta dinámicamente a medida que cambia la estructura de los participantes. Los datos muestran que distintas categorías de mercado corresponden a distintas estrategias óptimas: en áreas donde la información es más racional y la fijación de precios es más eficiente (por ejemplo, mercados financieros), el espacio para operar en contra es menor; mientras que en áreas donde el sentimiento es más fuerte y la irracionalidad está más concentrada (como entretenimiento y deportes), el mercado presenta con más facilidad desviaciones de precio, lo que crea oportunidades para operar en contra.

Aún más importante, este equilibrio también cambia de forma significativa en la dimensión del tiempo. En los primeros años (2021–2023), el taker era el grupo que obtenía ganancias y la estrategia óptima se inclinaba hacia el cierre activo de operaciones; pero después del estallido del volumen de operaciones en el cuarto trimestre de 2024, entraron muchos creadores de mercado profesionales, la estructura del mercado cambió y la estrategia de equilibrio se desplazó hacia maker (aprox. 65%–70%). Ese es un resultado típico de la teoría de juegos: cuando cambia la estructura de los participantes, la estrategia óptima evoluciona en consecuencia. Las estrategias que antes funcionaban en un “entorno de novatos” pueden quedar rápidamente inutilizadas frente a “oponentes profesionales”, y por eso el “modo de jugar” del mercado sigue iterando.

Resumen

El 87% de las carteras de mercados de predicción termina con pérdidas; esto no es porque el mercado esté manipulado, sino porque estos traders nunca hicieron realmente cálculos. Compran contratos raros a precios peores que los de las tragamonedas, deciden el tamaño de la posición por intuición, ignoran los cambios en la nueva información y, en cada operación a precio de mercado, pagan por el “optimismo”.

Y esos participantes que logran mantener ganancias continuas (el 13%) no tienen mejor suerte, sino que usan estas 5 fórmulas como un sistema completo: desde el juicio hasta la ejecución, forman un flujo completo, y cada paso se basa en los datos de 72.10 millones de operaciones reales.

Esa ventana no va a existir para siempre. A medida que entran creadores de mercado profesionales, el spread de precios se está comprimiendo rápidamente; en 2022, el taker todavía tenía una ventaja de aproximadamente +2.0%, pero hoy ya se ha revertido a -1.12%.

La cuestión es solo esta: ¿seguirás el avance del mercado junto con él, o seguirás comprando una lotería de 1 dólar usando un rendimiento de 0.43 dólares?

BTC2,25%
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado