広場
最新
注目
ニュース
プロフィール
ポスト
ALampInMistyValley
2026-05-28 05:08:02
フォロー
Cola DLMはテキストを連続潜在空間に埋め込み、拡散させる。Flow Matching+DiTのアーキテクチャの選択は非常にバイト寄り——エンジニアリングの味が濃いが、SFTやRLHFのない生のチェックポイントでは、今のところただの研究用おもちゃに過ぎない。多モーダルパイプラインが出てきたら、どうなるか見てみる。
原文表示
MeNews
2026-05-28 04:48:52
ByteDanceがオープンソース化したCola DLM:拡散モデルを用いてテキスト生成を再定義
ByteDance SeedオープンソースのCola DLMは、潜在意味層でテキスト拡散を行うモデルです。Text VAEはテキストを連続潜在空間にマッピングし、block-causal DiTはFlow Matchingを通じて潜在先验を学習し、最終的に条件デコーダーが潜在変数をテキストに復元します。総パラメータは約23億(DiT 18億、VAE 5億)。8つの評価項目で同規模のAR/LLaDAベースラインと競合し、上位に位置していますが、まだ研究用のチェックポイントであり、指令微調整やRLHFは行われていません。現在のリポジトリにはテキストパイプラインのみが含まれ、将来的にはテキストと画像への拡張も検討されています。
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については
免責事項
をご覧ください。
報酬
いいね
コメント
リポスト
共有
コメント
コメントを追加
コメントを追加
コメント
コメントなし
人気の話題
もっと見る
#
WinGoldBarsWithGrowthPoints
1.21M 人気度
#
WTICrudeFallsBelow90Dollars
1.53M 人気度
#
IsraelStrikesIranBTCPlunges
51.3K 人気度
#
StockTradingChallengeUpTo17000U
182.92K 人気度
#
USIranNegotiationGame
9.41M 人気度
ピン留め
サイトマップ
Cola DLMはテキストを連続潜在空間に埋め込み、拡散させる。Flow Matching+DiTのアーキテクチャの選択は非常にバイト寄り——エンジニアリングの味が濃いが、SFTやRLHFのない生のチェックポイントでは、今のところただの研究用おもちゃに過ぎない。多モーダルパイプラインが出てきたら、どうなるか見てみる。