📢 Gate 廣場 TradFi 交易分享挑戰上線!
晒单瓜分 $30,000 獎池,新人首帖 100% 中獎!
📌 參與方式:
帶 #TradFi交易分享挑战 發帖,滿足以下任一即可:
🔹 帶今日指定 TradFi 幣種標籤發帖交流。
🔹 完成單筆大於 $10U 的 TradFi CFD 交易並掛載交易卡片。
🏷️ 今日指定標籤:USDJPY、AUDUSD、US30、TSLA、JPN225
🎁 寵粉福利:
1️⃣ 卡片分享獎: 抽 50 人,每人送 $100 仓位體驗券!
2️⃣ 發帖榜單獎: 衝排行榜,贏 WCTC 限定 T 恤!
3️⃣ 新粉見面禮: 新人首次發帖,100% 領 $10 體驗券!
詳情:https://www.gate.com/announcements/article/51221
何恺明團隊ELF:語言擴散模型終於跑通
擴散模型在圖像生成裡已經成熟,但放到文本上一直很別扭:圖像天生是連續信號,語言卻由離散 token 組成。此前不少連續擴散文本模型,要么在生成軌跡中反覆引入 token 級監督,要么需要額外獨立解碼器。ELF 的做法更乾淨:大部分步驟只在連續向量空間裡去噪,最終一步再用共享權重網絡完成離散化。
實驗結果也有沖擊力。在 OpenWebText 無條件生成評測中,105M 參數的 ELF-B 用 32 步採樣達到約 24.1 的 Gen. PPL,優於多種離散和連續擴散語言模型基線。更關鍵的是,ELF-B 只用了約 45B 訓練 token,而對比方法通常超過 500B,訓練 token 少了約一個數量級。這個結果至少說明,連續擴散路線在語言建模裡並沒有被「語言離散性」堵死,之前的問題更可能出在建模接口和採樣設計上。