DeepSeek-V4-FlashがHuawei Cloudにリリースされました

2024年4月24日、DeepSeek-V4モデルが正式リリースされ、オープンソース化されました。華為クラウドが初めて適応しました。
DeepSeek-V4に対して、華為クラウドはモデル層の注意力圧縮メカニズムを初導入し、V4の注意力メカニズム下でのKVキャッシュの効率的な割り当て管理を実現しました。
TopK、SWA、CFAなどの10以上の昇天高性能融合演算子を提供し、フレームワークの非同期スケジューリングやMTP多ステップ投機などのフレームワーク最適化と組み合わせて、ネイティブの1M長のコンテキストで高性能推論をサポートします。
現在、華為クラウドのMaaSモデル即サービスプラットフォームは、開発者に対して、DeepSeek-V4-Flash APIをワンタッチで呼び出せるトークンサービスを提供しています。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし