Cơ bản
Giao ngay
Giao dịch tiền điện tử một cách tự do
Giao dịch ký quỹ
Tăng lợi nhuận của bạn với đòn bẩy
Chuyển đổi và Đầu tư định kỳ
0 Fees
Giao dịch bất kể khối lượng không mất phí không trượt giá
ETF
Sản phẩm ETF có thuộc tính đòn bẩy giao dịch giao ngay không cần vay không cháy tải khoản
Giao dịch trước giờ mở cửa
Giao dịch token mới trước niêm yết
Futures
Truy cập hàng trăm hợp đồng vĩnh cửu
TradFi
Vàng
Một nền tảng cho tài sản truyền thống
Quyền chọn
Hot
Giao dịch với các quyền chọn kiểu Châu Âu
Tài khoản hợp nhất
Tối đa hóa hiệu quả sử dụng vốn của bạn
Giao dịch demo
Giới thiệu về Giao dịch hợp đồng tương lai
Nắm vững kỹ năng giao dịch hợp đồng từ đầu
Sự kiện tương lai
Tham gia sự kiện để nhận phần thưởng
Giao dịch demo
Sử dụng tiền ảo để trải nghiệm giao dịch không rủi ro
Launch
CandyDrop
Sưu tập kẹo để kiếm airdrop
Launchpool
Thế chấp nhanh, kiếm token mới tiềm năng
HODLer Airdrop
Nắm giữ GT và nhận được airdrop lớn miễn phí
Pre-IPOs
Mở khóa quyền truy cập đầy đủ vào các IPO cổ phiếu toàn cầu
Điểm Alpha
Giao dịch trên chuỗi và nhận airdrop
Điểm Futures
Kiếm điểm futures và nhận phần thưởng airdrop
Đầu tư
Simple Earn
Kiếm lãi từ các token nhàn rỗi
Đầu tư tự động
Đầu tư tự động một cách thường xuyên.
Sản phẩm tiền kép
Kiếm lợi nhuận từ biến động thị trường
Soft Staking
Kiếm phần thưởng với staking linh hoạt
Vay Crypto
0 Fees
Thế chấp một loại tiền điện tử để vay một loại khác
Trung tâm cho vay
Trung tâm cho vay một cửa
Tôi vừa thấy Intel đã cung cấp trên Hugging Face các phiên bản đã được lượng tử hóa INT4 của các mô hình video Wan 2.2 của Alibaba. Điều này rất thú vị về mặt tối ưu hóa mô hình.
Về cơ bản, Intel đã giảm kích thước của các trọng số của mỗi mô hình một cách đáng kể. Mỗi trọng số từng chiếm 2 byte trong BF16 giờ chỉ còn chiếm 0,5 byte sau khi lượng tử hóa INT4. Điều này có nghĩa là tổng kích thước giảm xuống khoảng một phần tư so với ban đầu. Công cụ được sử dụng là AutoRound.
Ba mô hình được phát hành là T2V-A14B (chữ để video), I2V-A14B (hình ảnh để video) và TI2V-5B (đầu vào hỗn hợp văn bản và hình ảnh). Các mô hình A14B gốc chạy trên kiến trúc MoE với tổng cộng 27 tỷ tham số, trong đó 14 tỷ được kích hoạt mỗi bước. Nếu không lượng tử hóa INT4, chúng yêu cầu ít nhất 80GB VRAM mỗi GPU chỉ để xử lý độ phân giải 720p.
Thứ tiện lợi nhất là TI2V-5B, một mô hình dày đặc có thể chạy 720p ở 24fps trên GPU 4090 ngay cả ở dạng ban đầu. Tưởng tượng sau khi áp dụng tối ưu hóa INT4.
Điều quan trọng là Intel vẫn chưa công bố các benchmark đầy đủ về tiêu thụ VRAM hoặc chất lượng hình ảnh sau khi lượng tử hóa INT4. Sẽ còn phụ thuộc vào kiểm tra của bên thứ ba. Đối với ai muốn thử nghiệm, Intel chỉ ra nhánh vllm-omni là lựa chọn triển khai, vì các mô hình này không chạy trong pipeline chính của vLLM.
Đây là loại tối ưu hóa giúp các mô hình video này trở nên dễ tiếp cận hơn nhiều đối với những người không có phần cứng cao cấp.