RAEv2 mã nguồn mở: Tăng tốc hội tụ gấp 10 lần, 80 vòng huấn luyện vượt qua kỷ lục 800 vòng của thế hệ trước

robot
Đang tạo bản tóm tắt
Tin tức từ CoinWorld, dự án mã nguồn mở RAEv2 do Adobe Research, Đại học Quốc gia Úc (ANU) và nhóm谢赛宁 của Đại học New York (NYU) phối hợp ra mắt, tốc độ hội tụ tăng gấp 10 lần, huấn luyện 80 vòng vượt qua kỷ lục 800 vòng của thế hệ trước. Phiên bản mới là giải pháp tái tạo hình ảnh bằng mô hình khuếch tán thay thế biến phân tự mã hóa truyền thống (VAE), giải quyết các điểm đau như chất lượng tái tạo ban đầu kém, không thể sử dụng hướng dẫn không phân loại tiêu chuẩn (CFG) và hội tụ cực kỳ chậm. Trên ImageNet chỉ cần huấn luyện 80 vòng để đạt điểm toàn cục GFID (FID toàn cầu) là 1.06. Nhóm nghiên cứu đã thực hiện ba tối ưu cốt lõi trong thiết kế kiến trúc, sử dụng phương án biểu diễn nhiều lớp, cộng trực tiếp đầu ra của K lớp cuối cùng của bộ mã hóa, giữ nguyên cấu trúc của không gian con tầng dưới. Kiến trúc mới còn làm rõ cơ chế bổ sung của biểu diễn tự mã hóa và căn chỉnh biểu diễn (REPA), giúp thể hiện mạnh mẽ hơn trong các nhiệm vụ sinh. Thử nghiệm cho thấy, để đạt chỉ số GFID nhỏ hơn 2, mô hình thế hệ đầu cần 177 vòng, trong khi kiến trúc mới chỉ cần 35 vòng.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • 9
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
GateUser-b6d80ba0
· 4giờ trước
Cộng các lớp cuối cùng của bộ mã hóa, mang chút cảm giác của kết nối bỏ qua ResNet nhưng được sử dụng trong không gian tiềm ẩn
Xem bản gốcTrả lời0
NeonVortexInTheSmog
· 4giờ trước
Phân tán tái cấu trúc + tương thích CFG, trả hết nợ kỹ thuật một lần
Xem bản gốcTrả lời0
CyberBridgeDeepPerspective
· 4giờ trước
35 vòng GFID<2, hiệu quả này khiến các thợ luyện đan vui mừng
Xem bản gốcTrả lời0
RevokingPermissionsOnARainy
· 4giờ trước
Cuối cùng đã có người nghiêm túc giải quyết vấn đề mờ khi tái tạo VAE, xúc động quá
Xem bản gốcTrả lời0
HoldingPositionsIsLikeTending
· 4giờ trước
Adobe+ANU+NYU ba công ty hợp tác, tài nguyên đã được huy động đầy đủ
Xem bản gốcTrả lời0
CandleAfterTheRain
· 4giờ trước
Biểu diễn nhiều lớp giữ lại cấu trúc nền tảng, thiết kế này rất tinh vi, không đơn giản chỉ là xếp chồng độ sâu
Xem bản gốcTrả lời0
BitByBitBenny
· 4giờ trước
GFID 1.06 chỉ có 80 vòng, thế hệ trước 177 vòng bị cắt ngang còn nhiều, tốc độ hội tụ tăng vọt
Xem bản gốcTrả lời0
GateUser-0f8d377b
· 4giờ trước
Nhóm của Xie Saining đã kết hợp tái thiết và tạo ra, cơ chế bổ sung của REPA có chút gì đó đặc biệt
Xem bản gốcTrả lời0
Salt-BakedSentimentChart
· 4giờ trước
Mô hình khuếch tán làm VAE, ý tưởng thực sự rất sáng tạo
Xem bản gốcTrả lời0
Xem thêm
  • Đã ghim