Polymarket Bíblia do Arbitragem: A Verdadeira Diferença Está na Infraestrutura Matemática

MarsBitNews · 2026-03-11T05:17:48+00:00

Título original: A Matemática Necessária para Negociar na Polymarket (Roteiro Completo)Autor original: RoanFonte original:Reprodução: Mars FinanceDurante a criação do @insidersdotbot, tive profundas trocas com várias equipes de market making de alta frequência e equipes de arbitragem, sendo que a maior necessidade era entender como desenvolver estratégias de arbitragem.Os nossos utilizadores, amigos e parceiros estão explorando essa rota de negociação complexa e multidimensional que é a arbitragem na Polymarket. Se és um utilizador ativo do Twitter, acredito que já te deparaste com a frase «Eu consegui»

MarsBitNews

2026-03-11 05:17:48

O Título Original: The Math Needed for Trading on Polymarket (Complete Roadmap)

Autor Original: Roan

Fonte Original:

Reprodução: Mars Finance

Durante a criação do @insidersdotbot, tive profundas trocas de ideias com várias equipes de market makers de alta frequência e de arbitragem. Uma das maiores demandas foi: como desenvolver estratégias de arbitragem.

Nossos usuários, amigos e parceiros estão explorando a complexa e multidimensional rota de arbitragem na Polymarket. Se você é um usuário ativo do Twitter, provavelmente já viu tweets como: “Com a estratégia de arbitragem XX, ganhei tanto na previsão de mercado.”

Porém, a maioria dos artigos simplifica demais a lógica de arbitragem, transformando-a numa questão de “eu também consigo” ou “com Clawdbot resolve”, sem explicar detalhadamente como entender sistematicamente e desenvolver seu próprio sistema de arbitragem.

Se você quer entender como as ferramentas de arbitragem na Polymarket realmente lucram, este artigo é a leitura mais completa que encontrei até agora.

Devido ao alto nível técnico do texto original em inglês, com partes que requerem estudo aprofundado, reestruturei e adicionei explicações para facilitar a compreensão, de modo que você possa entender todo o conteúdo sem precisar parar para pesquisar.

Arbitragem na Polymarket não é uma questão simples de matemática

Imagine que você vê um mercado na Polymarket:

Preço YES: $0.62, preço NO: $0.33.

Você pensa: 0.62 + 0.33 = 0.95, menos de 1 dólar, há oportunidade de arbitragem! Comprando YES e NO por $0.95, independentemente do resultado, você recupera $1.00, lucrando $0.05.

Você está certo.

Mas o problema é que — enquanto você faz essa soma manual, o sistema de quantificação já está fazendo algo completamente diferente.

Ele escaneia simultaneamente 17.218 condições, cruzando 2^63 combinações possíveis de resultados, encontrando contradicções de precificação em milissegundos. Quando você realiza duas ordens, a oportunidade desaparece. O sistema já identificou vulnerabilidades semelhantes em dezenas de mercados relacionados, calculou o tamanho ótimo de posições considerando profundidade de livro e taxas, executou todas as operações em paralelo e já direcionou os fundos para a próxima oportunidade.[1]

A diferença não é só velocidade. É infraestrutura matemática.

Capítulo 1: Por que “adição” não é suficiente — o problema do poliedro marginal

Erro em mercado único

Vamos a um exemplo simples.

Mercado A: “Trump vai ganhar a eleição na Pensilvânia?”

Preço YES: $0.48, NO: $0.52. Juntos, somam exatamente $1.00.

Parece perfeito, sem oportunidade de arbitragem, certo?

Errado.

Adicionando um mercado, surge o problema:

Mercado B: “O Partido Republicano vai superar o adversário na Pensilvânia em mais de 5 pontos percentuais?”

YES: $0.32, NO: $0.68. Também soma $1.00.

Cada mercado parece “normal”. Mas há uma dependência lógica:

A eleição presidencial nos EUA não é uma contagem de votos nacional, mas por estado. Cada estado é uma “batalha” independente, quem ganha mais votos naquele estado leva todos os votos eleitorais (sistema winner-takes-all). Trump é candidato republicano. Então, “Republicano ganha na Pensilvânia” e “Trump ganha na Pensilvânia” — são a mesma coisa. Se o Partido Republicano vence por mais de 5 pontos, isso significa que Trump venceu na Pensilvânia com uma margem grande.

Em outras palavras, o YES do mercado B (grande vitória republicana) é um subconjunto do YES do mercado A (Trump vence). Uma vitória grande implica vitória, mas vitória não implica vitória grande.

Essa dependência lógica cria uma oportunidade de arbitragem.

É como apostar em duas coisas — “Vai chover amanhã?” e “Vai haver tempestade?”. Se houver tempestade, certamente vai chover (tempestade é subconjunto de chuva). Assim, o preço de “Tempestade YES” não pode ser maior que “Chuva YES”. Se os preços violarem essa lógica, você pode comprar barato e vender caro ao mesmo tempo, obtendo lucro “sem risco”, ou seja, arbitragem.

Explosão de combinações: por que busca exaustiva não funciona

Para qualquer mercado com n condições, teoricamente há 2^n combinações de preços possíveis.

Parece viável? Veja um caso real.

Na NCAA 2010, o mercado de torneio [2]: 63 jogos, cada um com duas possibilidades (ganha/perde). O número de combinações possíveis é 2^63 = 9.22 quintilhões — mais de 9 quintilhões de possibilidades. Existem mais de 5000 mercados.

Quanto é 2^63? Se você verificar 1 bilhão de combinações por segundo, levaria cerca de 292 anos para verificar tudo. Por isso, busca exaustiva aqui é inviável.

Verificar uma a uma? Impossível computacionalmente.

Para as eleições de 2024, uma equipe de pesquisa identificou 1.576 pares de mercados com dependências potenciais. Se cada par tiver 10 condições, são 2^10 = 1024 combinações por par. Multiplicando por 1.576, seu computador terminaria antes do resultado da eleição.

Programação inteira: substituindo enumeração por restrições

A solução do sistema de quantificação não é “enumerar mais rápido”, mas “não enumerar”.

Usam programação inteira (Integer Programming) para descrever quais resultados são possíveis.

Exemplo real: mercado de Duke vs Cornell. Cada time tem 7 possibilidades de vitória (0 a 6 vitórias), totalizando 14 condições. Sem restrições, há 2^14 = 16.384 combinações.

Mas há uma restrição: eles não podem ambos vencer mais de 4 jogos, pois se ambos vencerem 5 ou mais, se enfrentam na semifinal (apenas um pode avançar).

Como a programação inteira resolve? Com três restrições lineares:

· Restrição 1: Os 7 indicadores de Duke, exatamente um é verdadeiro (Duke só pode ter um número final de vitórias).

· Restrição 2: Os 7 indicadores de Cornell, exatamente um é verdadeiro.

· Restrição 3: Soma das vitórias de Duke e Cornell, com valores 5 ou 6, deve ser ≤ 1 (não podem ambos vencer 5 ou mais).

Três restrições lineares substituem a verificação exaustiva de 16.384 combinações.

Em outras palavras, busca exaustiva é como ler todas as palavras do dicionário procurando uma. Programação inteira é como abrir a página de palavras que começam com uma letra específica. Você não precisa verificar tudo, só descrever “como é a resposta válida” e deixar o algoritmo procurar violações.

Dados reais: 41% dos mercados apresentam arbitragem [2]

O estudo analisou dados de abril de 2024 a abril de 2025:

• 17.218 condições verificadas

• 7.051 condições com arbitragem de mercado única (41%)

• Desvio mediano de preço: $0.60 (deveria ser $1.00)

• 13 pares de mercados com arbitragem cruzada confirmada

Desvio mediano de $0.60 indica que os mercados frequentemente se desviam em 40%. Isso não é “quase eficiente”, é “amplamente explorável”.

Capítulo 2: Projeção de Bregman — como calcular a arbitragem ótima

Encontrar arbitragem é um problema. Calcular a melhor arbitragem, outro.

Você não pode simplesmente “fazer uma média” ou “ajustar preços”. Precisa projetar o estado atual do mercado para o espaço de preços sem arbitragem, preservando a estrutura de informações.

Por que a “distância linear” não funciona

A ideia mais intuitiva é: encontrar o preço “legal” mais próximo do atual, ou seja, minimizar a distância Euclidiana: ||μ - θ||²

Porém, há um problema fatal: ela trata todas as mudanças de preço como iguais.

De $0.50 para $0.60, e de $0.05 para $0.15, ambas representam um aumento de 10 centavos. Mas o significado é completamente diferente.

Por quê? Porque o preço representa uma probabilidade implícita. De 50% para 60% é uma mudança moderada de opinião. De 5% para 15% é uma mudança de crença enorme — um evento quase impossível que de repente se torna “um pouco provável”.

Imagine que você está pesando. De 70 kg para 80 kg, diria “engordou um pouco”. De 30 kg para 40 kg (se for adulto), é “quase morrendo de fome” para “gravemente desnutrido”. Mesmo peso, significado diferente. O mesmo vale para preços: quanto mais próximo de 0 ou 1, maior a informação.

Divergência de Bregman: a “distância” correta

Market makers na Polymarket usam LMSR (regra de pontuação de mercado logarítmica)[4], onde os preços representam distribuições de probabilidade.

Nessa estrutura, a métrica correta não é a distância Euclidiana, mas a divergência de Bregman.[5]

Para LMSR, ela se torna a divergência de KL (Kullback-Leibler)[6], que mede a “distância” entre duas distribuições de probabilidade, do ponto de vista da teoria da informação.

Você não precisa memorizar a fórmula. Basta entender:

A divergência de KL dá mais peso às mudanças próximas de extremos de preço. De $0.05 para $0.15, ela é mais “distante” do que de $0.50 para $0.60. Isso condiz com nossa intuição — mudanças em preços extremos representam maior impacto informacional.

Um exemplo famoso foi na previsão do mercado do @zachxbt, onde a Axiom superou Meteora no final, com mudanças extremas de preço, que marcaram toda a variação.

Lucro de arbitragem = distância de projeção de Bregman

Essa é uma das conclusões centrais do artigo original:

Qualquer operação de arbitragem que garanta o maior lucro possível é igual à distância de projeção de Bregman do estado atual do mercado para o espaço sem arbitragem.

Em outras palavras: quanto mais os preços se afastarem do espaço “legal”, maior o potencial de lucro. E a projeção de Bregman indica:

O que comprar e vender (direção da projeção)
Quanto comprar e vender (considerando profundidade de livro)
Quanto é possível lucrar (distância de projeção = lucro máximo)

O maior arbitrador do ano lucrou $2.009.631,76.[2] Sua estratégia foi resolver essa otimização mais rápido e com maior precisão que os demais.

Imagine: você está no topo de uma montanha, na base há um rio (espaço sem arbitragem). Sua posição atual (preço de mercado) está a uma certa distância do rio.

A projeção de Bregman é como encontrar o “caminho mais curto” até o rio — não uma linha reta, mas considerando o relevo (estrutura do mercado). O comprimento desse caminho é o seu lucro máximo potencial.

Capítulo 3: Algoritmo de Frank-Wolfe — transformar teoria em código executável

Agora você sabe: para calcular a arbitragem ótima, precisa fazer a projeção de Bregman.

Mas o problema é que — calcular diretamente essa projeção é inviável.

Por quê? Porque o espaço sem arbitragem (o poliedro marginal M) tem um número exponencial de vértices. Métodos padrão de otimização convexa precisam acessar todas as restrições, ou seja, enumerar cada resultado válido. Como já discutido, isso é impossível em escala.

A ideia central do Frank-Wolfe

O algoritmo de Frank-Wolfe [7] é genial porque: não tenta resolver tudo de uma vez, mas aproxima passo a passo.

Funciona assim:

Primeiro: começa com um conjunto pequeno de resultados válidos conhecidos.

Depois: otimiza nesse conjunto, encontra a solução atual.

Em seguida: usa programação inteira para encontrar um novo resultado válido, adiciona ao conjunto.

Por fim: verifica se a solução está próxima o suficiente do ótimo. Se não, repete.

Cada rodada adiciona um vértice ao conjunto. Mesmo com 100 iterações, você só acompanha 100 vértices — não 2^63.

Imagine que você está num labirinto gigante procurando a saída.

Busca exaustiva é como tentar todas as rotas. Frank-Wolfe é como: primeiro, escolhe uma rota aleatória, depois, em cada bifurcação, pergunta a um “guia” (resolver um problema de programação inteira): “De onde aqui, qual direção provavelmente leva à saída?” Assim, você não explora tudo, só faz boas escolhas nos pontos-chave.

Resolver programação inteira: o “guia” de cada passo

Cada rodada do Frank-Wolfe exige resolver um problema de programação linear inteira. Em teoria, NP-difícil (não há algoritmo rápido conhecido).

Porém, solvers modernos, como Gurobi[8], são eficientes para problemas bem estruturados.

A equipe usou Gurobi 5.5. Tempo de resolução na prática:

• Primeiras iterações (poucas partidas): menos de 1 segundo

• Médio (30-40 partidas): 10-30 segundos

• Finais (mais de 50 partidas): menos de 5 segundos

Por que fica mais rápido na fase final? Porque, com resultados mais certos, o espaço viável diminui. Variáveis e restrições ficam mais restritas, resolvendo mais rápido.

Problema de explosão de gradiente e Barrier Frank-Wolfe

O método padrão de Frank-Wolfe tem um problema técnico: quando o preço se aproxima de 0, o gradiente do LMSR tende a -∞, tornando a otimização instável.

A solução é o Barrier Frank-Wolfe: ao invés de otimizar na totalidade do poliedro M, otimiza em uma versão “restringida” Mε, que é uma versão suavizada, com parâmetro ε que diminui ao longo das iterações — começando mais afastado da borda, depois se aproximando.

Estudos mostram que, na prática, 50 a 150 iterações são suficientes para convergir.

Desempenho real

Na pesquisa, foi constatado [2]:

Nos primeiros 16 jogos do torneio NCAA, o market maker FWMM (Frank-Wolfe Market Maker) e o market maker linear simples (LCMM) tiveram desempenho semelhante — porque o solver de programação inteira ainda era lento.

Depois de 45 jogos, a projeção de 30 minutos foi bem-sucedida.

Desde então, o FWMM superou o LCMM em 38% na precificação.

O ponto de virada foi quando o espaço de resultados ficou pequeno o suficiente para que o solver pudesse resolver dentro do tempo de mercado.

O FWMM é como um estudante que faz uma preparação inicial, mas, uma vez no ritmo, consegue dominar. O LCMM é aquele que mantém uma performance estável, mas com limite de potencial. A grande diferença: o FWMM tem uma “arma” mais poderosa (projeção de Bregman), só precisa de tempo para “carregar a arma” (esperar o solver).

Capítulo 4: Execução — por que, mesmo calculando, ainda pode haver perdas

Você detectou arbitragem. Calculou a melhor operação com Bregman.

Agora, precisa executar.

E aqui está o ponto onde a maioria das estratégias falha.

Problema de execução não atômica

A Polymarket usa CLOB (Central Limit Order Book)[9]. Diferente de DEXs, as ordens são executadas sequencialmente — não há garantia de execução simultânea.

Seu plano de arbitragem:

Comprar YES a $0.30. Comprar NO a $0.30. Custo total: $0.60. Independentemente do resultado, recuperar $1.00. Lucro potencial: $0.40.

Na prática:

· Envia ordem de compra de YES → executa a $0.30 ✓

· Sua ordem altera o mercado, mudando o preço

· Envia ordem de compra de NO → executa a $0.78 ✗

· Custo total: $1.08. Recupera $1.00. Resultado: prejuízo de $0.08.

Uma ordem foi executada, a outra não. Você ficou exposto ao risco.

Por isso, o artigo só considera oportunidades com potencial de lucro acima de $0.05. Menores spreads podem ser consumidos pelo risco de execução.

VWAP: preço médio real de execução

Não assuma que consegue fechar ao preço de oferta. Calcule o VWAP (Volume Weighted Average Price)[10].

A equipe analisou cada bloco na Polygon (cerca de 2 segundos), calculando o VWAP de todas as negociações YES e NO nesse período. Se |VWAP_yes + VWAP_no - 1.0| > 0.02, registra como oportunidade de arbitragem [2].

VWAP é o “preço médio que você realmente pagou”. Se você quer comprar 10.000 tokens, mas há apenas 2.000 a $0.30, 3.000 a $0.32 e 5.000 a $0.35, seu VWAP será (2000×0.30 + 3000×0.32 + 5000×0.35)/10000 = $0.326, mais alto que o preço “ideal” de $0.30.

Restrições de liquidez: quanto você pode lucrar depende da profundidade do livro

Mesmo com preço desviado, seu lucro máximo é limitado pela liquidez disponível.

Exemplo real [2]:

Mercado mostra preço de arbitragem: soma de YES = $0.85. Lucro potencial: $0.15 por dólar. Mas a profundidade do livro é apenas $234. Lucro máximo: $234 × $0.15 = $35,10.

Para arbitragem cruzada, você precisa de liquidez em todas as posições ao mesmo tempo. O menor limite de liquidez define seu limite máximo.

Por isso, plataformas de quantificação consideram fundamental o impacto do preço na execução.

Capítulo 5: Sistema completo — o que realmente foi implementado

Teoria é limpa. Ambiente de produção é caótico.

Este é um exemplo de um sistema de arbitragem operacional [2].

Pipeline de dados

Dados em tempo real: conexão WebSocket com API da Polymarket [9], recebendo atualizações do livro, execuções, eventos de criação/liquidação de mercado.

Dados históricos: consulta via API do Alchemy Polygon para eventos de contrato — OrderFilled, PositionSplit, PositionsMerge.

A equipe analisou 86 milhões de negociações [2]. Essa escala exige infraestrutura, não é algo que um script resolve.

Há planos de abrir uma API de alta velocidade para trading, para quem desejar usar modelos similares. Contate-me via DM para mais detalhes.

Camada de detecção de dependências

Para 305 mercados de eleição nos EUA, há 46.360 pares de combinações possíveis. Análise manual é impossível.

A equipe usou uma abordagem inteligente: um grande modelo de linguagem (DeepSeek-R1-Distill-Qwen-32B) para triagem inicial.

Entrada: descrição das condições de dois mercados. Saída: JSON com combinações válidas.

Depois, três verificações:

Cada mercado tem exatamente uma condição verdadeira?
O número de combinações válidas é menor que n×m (dependências)?
O subconjunto dependente satisfaz condições de arbitragem?

Resultado: 40.057 pares independentes (sem arbitragem) → 1.576 pares dependentes (potencial arbitragem) → 374 pares com condições estritas → 13 validados manualmente [2].

Precisão do LLM em mercados complexos de múltiplas condições: 81,45%. Suficiente para triagem inicial, mas validação manual antes de execução.

Motor de otimização em três camadas

· Primeira camada: restrições lineares simples (LCMM). Verifica regras básicas — soma de probabilidades = 1, se A implica B, então P(A) ≤ P(B). Rápido, elimina erros evidentes.

· Segunda camada: projeção por programação inteira (Frank-Wolfe + Gurobi). O núcleo. Parâmetros: Alpha=0.9 (extrair pelo menos 90% da arbitragem), ε inicial=0.1 (10% de suavização), tolerância=1e-6, limite de tempo=30 min. Iterações típicas: 50-150. Tempo por rodada: 1-30 s.

· Terceira camada: validação de execução. Antes de enviar ordens, simula execução no livro atual. Verifica liquidez, slippage esperado, lucro garantido após slippage, se excede o mínimo de $0.05. Só executa se passar.

Gestão de posições: versão aprimorada da fórmula de Kelly

A fórmula de Kelly padrão [11] indica quanto do capital investir. Para arbitragem, ajusta-se pelo risco de execução:

f = (b×p - q) / b × √p

onde b é o percentual de lucro, p é a probabilidade de execução completa (estimada pela profundidade), q=1-p.

Limite: 50% da profundidade do livro. Acima disso, o impacto no mercado é grande demais.

Resultados finais

De abril de 2024 a abril de 2025, lucros totais:

Arbitragem de condições únicas: compra baixa e venda alta em $5.899.287 + venda baixa e compra alta em $4.682.075 = $10.581.362

Rebalanceamento de mercado: compra baixa de todos YES $11.092.286 + venda alta de todos YES $612.189 + compra de todos NO $17.307.114 = $29.011.589

Arbitragem cruzada: $95.634

Total: $39.688.585

Os 10 principais arbitradores capturaram $8.127.849 (20,5% do total). O primeiro colocado lucrou $2.009.632, com 4.049 operações, média de $496 por operação [2].

Não é loteria. Não é sorte. É execução sistemática com precisão matemática.

E a realidade final

Enquanto os traders ainda leem “10 dicas para prever mercados”, os sistemas de quantificação estão:

Detectando dependências entre 17.218 condições com programação inteira
Calculando a arbitragem ótima com Bregman
Lidando com explosão de gradiente via Barrier Frank-Wolfe
Estimando slippage com VWAP e executando ordens em paralelo
Extraindo sistematicamente quase 40 milhões de dólares de lucro garantido

A diferença não é sorte. É infraestrutura matemática.

O artigo é público [1]. Os algoritmos são conhecidos. Os lucros são reais.

A questão é: antes de extrair mais 40 milhões, você consegue construir algo assim?

Resumo de conceitos

• Poliedro marginal (Marginal Polytope) → espaço de preços “legais”. Preços dentro dele são livres de arbitragem.

• Programação inteira (Integer Programming) → descreve resultados válidos com restrições lineares, evitando enumeração exaustiva. Reduz 2^63 verificações a poucas restrições [3].

• Divergência de Bregman / KL → métrica de “distância” entre distribuições de probabilidade, mais adequada que Euclidiana, com peso maior para mudanças próximas de extremos [5][6].

• LMSR (regra de pontuação de mercado logarítmica) → mecanismo de precificação do market maker, onde preços representam probabilidades implícitas [4].

• Algoritmo de Frank-Wolfe → método iterativo que adiciona um vértice por vez, evitando enumeração exponencial [7].

• Gurobi → solver líder de programação inteira, “guia” de cada passo [8].

• CLOB (Central Limit Order Book) → mecanismo de matching de ordens sequencial, sem garantia de atomicidade [9].

• VWAP (Preço Médio Ponderado pelo Volume) → preço médio real de execução, considerando profundidade do livro. Mais realista que o preço de oferta [10].

• Fórmula de Kelly → indica quanto do capital investir, balanceando retorno e risco [11].

• Execução não atômica → múltiplas ordens que não garantem execução simultânea, expondo ao risco de uma ordem ser executada e a outra não.

• DeepSeek → modelo de linguagem para triagem de dependências de mercado, com acurácia de 81,45%.

Ver original

Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.

1 gostos