几百张卡就能扛住访客流量,这优化技术要是开源,中小厂能省多少算力预算?

币 界 网
币界网消息,OpenAI最近找到了一套优化方案,能够将模型推理成本削减一半以上。根据一位知情人士透露,OpenAI工程师在本月早些时候向部分同事表示,依托几项全新研发的优化技术,他们成功将所需的英伟达图形处理器(GPU)数量压至仅数百个,特别是在没有免费或付费账户的访客使用ChatGPT的场景中应用该技术后。
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论