tu enfoque clásico de AnyRes donde divides las imágenes en mosaicos y las procesas por separado, luego alimentas todo al LLM
también probaron eso con FastVLM. resulta que, sin teselado, FastVLM aún ofrece una experiencia más fluida
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
12 me gusta
Recompensa
12
4
Republicar
Compartir
Comentar
0/400
TommyTeacher1
· 09-02 14:38
Este algoritmo es alcista.
Ver originalesResponder0
BakedCatFanboy
· 09-02 14:37
¿Para qué dividir? No es mejor hacerlo de una vez.
también existe esta cosa llamada mosaico dinámico
tu enfoque clásico de AnyRes donde divides las imágenes en mosaicos y las procesas por separado, luego alimentas todo al LLM
también probaron eso con FastVLM. resulta que, sin teselado, FastVLM aún ofrece una experiencia más fluida