智谱AIは、選定された企業顧客向けにGLM-5.1高速APIをリリースし、出力速度は1秒あたり400トークンに達しました。智谱AIは、このサービスはTileRTと共同開発した推論エンジンを使用しており、今後もFP8推論や超長文コンテキストのサポートを追加していくと述べました。
智谱AI、400トークン/秒の高速API「GLM-5.1」をリリース