美团推出由国内计算集群支持的万亿参数模型的公开测试

2023年4月24日、業界筋によると、メイトゥアンの次世代基盤モデル、LongCat-2.0-Previewがテスト開始を迎え、総パラメータ規模が1兆を超え、世界有数の大規模モデルの一つとなった。関係者によると、DeepSeekも同日に次世代V4モデルをリリースし、総パラメータ数とアクティブパラメータ数はメイトゥアンのLongCat-2.0-Previewとほぼ一致している。パラメータ規模を超えて、メイトゥアンの新しい基盤モデルの大きな突破口は、そのトレーニングと推論が完全に国内のコンピューティングクラスターによって支えられている点にある。情報筋は、このトレーニング段階で使用されたコンピューティングカードの数が50,000から60,000の範囲であり、国内のコンピューティングリソースを用いた最大規模の大規模モデルのトレーニング作業であると指摘した。(出典:界面新聞)

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン