Qwen 3.6 27B DenseモデルはRTX 3090上で40トーク/秒に達する

robot
概要作成中

AIMPACT メッセージ、4 月 24 日(UTC+8)、2026 年 4 月 24 日、ユーザー @sudoingX が初期テスト結果を公開:Qwen 3.6 27B Dense モデルは、1枚の RTX 3090 24GB グラフィックカード上で、40 トークン/秒の速度で 10/10 テストに合格。この結果は、量子化技術や融合カーネルを使用せず、llama.cpp の Q4_K_M 直接量子化のみを採用している。ユーザーはまた、モデルを評価するための粒子群最適化ベンチマークも作成した。(出典:InFoQ)

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン