sua abordagem clássica AnyRes onde você divide imagens em tiles e as processa separadamente, depois alimenta tudo ao LLM
eles testaram isso com o FastVLM também. Acontece que, sem a divisão em blocos, o FastVLM ainda fornece uma experiência mais suave
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
12 Curtidas
Recompensa
12
4
Repostar
Compartilhar
Comentário
0/400
TommyTeacher1
· 09-02 14:38
Este algoritmo é bull!
Ver originalResponder0
BakedCatFanboy
· 09-02 14:37
Dividir o que? Não seria melhor fazer tudo de uma vez?
Ver originalResponder0
RamenDeFiSurvivor
· 09-02 14:35
O corte em pedaços ainda está mais lento, como assim?
há também esta coisa chamada tiling dinâmico
sua abordagem clássica AnyRes onde você divide imagens em tiles e as processa separadamente, depois alimenta tudo ao LLM
eles testaram isso com o FastVLM também. Acontece que, sem a divisão em blocos, o FastVLM ainda fornece uma experiência mais suave