Há mais de 3 anos, quando ainda brincava com sovits, naquela época o modelo de voz precisava ser separado (remover o ruído de fundo ambiental) para fazer o treinamento.


Depois, era necessário fazer uma triagem no conjunto de dados, removendo as partes com ruído de fundo alto, e então começar o treinamento.
Normalmente, treinava-se cerca de 8000 passos, a melhor fidelidade na reprodução do timbre; se ultrapassasse os 8000 passos e a pontuação ainda estivesse abaixo de 25, o conjunto de dados e o treinamento basicamente se tornavam inúteis.
Se você insistisse em continuar treinando, treinando até mais de 14000 passos, surgiria o chamado “divergência”, que acabava fazendo o som final ficar ou com “sintetizador de eletrônica grave” ou “som de pessoa que não é nem humano nem fantasma”.
Isso lembra o processo de desenvolvimento de trading quantitativo?
O processo de extrair o som seco é como dar ao modelo de autoaprendizagem e previsão um conjunto de dados, e remover as partes com ruído de fundo alto é como filtrar as negociações inválidas (como picos de alta ou baixa em 1 minuto).
Treinar por 8000 passos evita uma superajuste severa, e treinar até 14000 passos “diverge” (superajuste severo), levando ao resultado de mercado real que é praticamente como jogar moeda ao ar.
Embora não estejam na mesma área, a lógica subjacente é a mesma.
Não dá para saber se, no futuro, quem nos derrotar não será alguém de outro setor que cruzou o caminho, o que é realmente difícil de prever...
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar