218B疎な専門家モデルがオープンソース化、パラメータ規模はこの通りで、下流の微調整の余地は十分に大きい。

原文表示
BlockBeatNews
CohereオープンソースコマンドA+:218BパラメータMoE大型モデル、企業向けエージェントとデータ主権を重視
Cohere 正式オープンソース化された218Bパラメータのスパース混合専門家モデル Command A+、企業のプライベート展開とデータ主権を対象にし、ベンダーロックインを回避。推論活性化は25Bで、H100二枚またはB200一枚で対応可能で、低精度量子化オプションも提供。ネイティブなマルチモーダル入力、128Kのコンテキスト、64Kの出力、48言語をカバーし、複雑な推論、ツール呼び出し、長文処理に適用。
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン留め