cách tiếp cận AnyRes cổ điển của bạn, nơi bạn cắt nhỏ hình ảnh thành các ô và xử lý chúng riêng biệt, sau đó đưa mọi thứ vào LLM
họ đã kiểm tra điều đó với FastVLM nữa. hóa ra, không cần ghép hình, FastVLM vẫn cho kết quả mượt mà hơn.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
12 thích
Phần thưởng
12
4
Đăng lại
Chia sẻ
Bình luận
0/400
TommyTeacher1
· 09-02 14:38
Thuật toán này thật là牛啊
Xem bản gốcTrả lời0
BakedCatFanboy
· 09-02 14:37
Chia sẻ cái gì vậy? Không phải một bước đến nơi đến chốn thì tốt hơn sao?
Xem bản gốcTrả lời0
RamenDeFiSurvivor
· 09-02 14:35
Cắt thành từng miếng mà tốc độ còn chậm thì cũng được.
còn có cái gọi là gạch động
cách tiếp cận AnyRes cổ điển của bạn, nơi bạn cắt nhỏ hình ảnh thành các ô và xử lý chúng riêng biệt, sau đó đưa mọi thứ vào LLM
họ đã kiểm tra điều đó với FastVLM nữa. hóa ra, không cần ghép hình, FastVLM vẫn cho kết quả mượt mà hơn.