2023年4月24日、業界筋によると、メイトゥアンの次世代基盤モデル、LongCat-2.0-Previewがテスト開始を迎え、総パラメータ規模が1兆を超え、世界有数の大規模モデルの一つとなった。関係者によると、DeepSeekも同日に次世代V4モデルをリリースし、総パラメータ数とアクティブパラメータ数はメイトゥアンのLongCat-2.0-Previewとほぼ一致している。パラメータ規模を超えて、メイトゥアンの新しい基盤モデルの大きな突破口は、そのトレーニングと推論が完全に国内のコンピューティングクラスターによって支えられている点にある。情報筋は、このトレーニング段階で使用されたコンピューティングカードの数が50,000から60,000の範囲であり、国内のコンピューティングリソースを用いた最大規模の大規模モデルのトレーニング作業であると指摘した。(出典:界面新聞)
美团推出由国内计算集群支持的万亿参数模型的公开测试
2023年4月24日、業界筋によると、メイトゥアンの次世代基盤モデル、LongCat-2.0-Previewがテスト開始を迎え、総パラメータ規模が1兆を超え、世界有数の大規模モデルの一つとなった。関係者によると、DeepSeekも同日に次世代V4モデルをリリースし、総パラメータ数とアクティブパラメータ数はメイトゥアンのLongCat-2.0-Previewとほぼ一致している。パラメータ規模を超えて、メイトゥアンの新しい基盤モデルの大きな突破口は、そのトレーニングと推論が完全に国内のコンピューティングクラスターによって支えられている点にある。情報筋は、このトレーニング段階で使用されたコンピューティングカードの数が50,000から60,000の範囲であり、国内のコンピューティングリソースを用いた最大規模の大規模モデルのトレーニング作業であると指摘した。(出典:界面新聞)