疎なMoEアーキテクチャ、25Bの活性化パラメータで計算コストを大幅削減

原文表示
CoinNetwork
CohereオープンソースコマンドA+:218BパラメータMoE大型モデル、企業向けエージェントとデータ主権を重視
Cohereは正式に2180億パラメータのスパース混合専門家モデルCommand A+をオープンソース化し、Apache 2.0ライセンスの下で提供しています。企業向けエージェントとプライベート展開を対象とし、データ主権と物理的隔離を強調しています。全体で2180億パラメータ、単一推論で25億パラメータを活性化します。2枚のH100または1枚のB200で動作可能であり、Hugging FaceはW4A4などの低精度バージョンも提供しています。Command A+はネイティブにマルチモーダル入力をサポートし、128Kの入力コンテキストと64Kの出力長を持ち、複雑な推論、自律ツール呼び出し、データベースクエリなどのワークフローや長文ドキュメントに対応します。また、EU公式言語を含む48言語をサポートしています。
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン留め