Gemini3.1Flash-Lite正式发布:输入价只有Claude4.5Haiku四分之一,GPQA高出近14个百分点

币界网消息,谷歌Gemini 3.1 Flash-Lite正式发布,成为Gemini 3系列中最便宜、最快的模型,已进入高并发生产环境。该模型支持四档推理强度控制(minimal、low、medium、high),用户可根据场景调节速度与质量。定价维持在预览水平:输入0.25美元/百万token,输出1.50美元/百万token,输入价为Claude 4.5 Haiku的四分之一,输出价不到三分之一。性能方面,GPQA Diamond得分86.9%,超过Claude 4.5 Haiku的73.0%和GPT-5 Mini的82.3%MMMU-PRO得分76.8%。输出速度为363 tokens/s,比2.5 Flash快45%。

此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论