Este artigo sobre forecasting RL (aprendizado por reforço para previsão) é bem interessante.



O que ele faz pode ser entendido assim:

Pega um lote de questões históricas de previsão que já têm resultados, e faz a IA voltar ao ponto no tempo da época.

Mas não pode deixar ela acessar a internet de hoje, senão ela veria as respostas.

Então o autor montou um ambiente de "máscara temporal":

A busca só pode acessar materiais anteriores àquela época;

Páginas web são lidas através de snapshots históricos;

Dados financeiros e de tendências também só mostram o que era visível na época.

Depois, deixa o modelo pesquisar por conta própria, julgar as evidências e dar uma probabilidade.

Quando o resultado real é revelado, usa-se uma proper scoring rule para pontuar, e então o RL é usado para reforçar o processo de previsão que teve melhor desempenho.

O mais interessante é isso:

Não se treina uma resposta única, mas sim todo o conjunto de ações de previsão:

O que pesquisar, o que ler, quando parar, como lidar com evidências conflitantes e, por fim, qual probabilidade atribuir.

Aplicando isso a mercados de previsão, acho que o primeiro passo não é fazer a IA negociar automaticamente.

É melhor primeiro deixá-la manter um forecast diary (diário de previsões):

1. Probabilidade na época
2. Evidências usadas
3. Preço de mercado
4. Se negociaria ou não
5. Resultado posterior
6. Classificação do erro

Se um sistema diz 60% das vezes, mas no longo prazo não chega perto de 60%, então não é uma estratégia, é só alguém que sabe escrever justificativas.

Se você também quer praticar "registrar previsão → esperar resultado → calibrar a si mesmo", pode começar com valores pequenos/simulados, tratando isso como um diário de previsões, e não como recomendação de negociação.

Os links que eu uso:

O original está aqui:

O que acho mais digno de nota não é a conclusão em si, mas como ele decompõe a "previsão" em um processo que pode ser treinado e revisado.
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Fixado