广场
最新
热门
资讯
我的主页
发布
V4-Pro内部评测:编码通过率逼近Opus4.5,52%内测者认可为默认模型
ME News
2026-07-02 07:13:03
关注
摘要生成中
ME News 消息,4 月 24 日(UTC+8),据 动察 Beating 监测,V4 罕见公开了内部 dogfooding 数据。团队从 50 余名工程师收集约 200 个真实研发任务,覆盖功能开发、bug 修复、重构和诊断,技术栈包括 PyTorch、CUDA、Rust、C++,经严格筛选后保留 30 个作为评测集。 V4-Pro-Max 通过率 67%,显著高于 Sonnet 4.5 的 47%,接近 Opus 4.5 的 70%,但低于 Opus 4.5 Thinking 的 73% 和 Opus 4.6 Thinking 的 80%。Haiku 4.5 通过率仅 13%。 在一项 N=85 的内部调查中,所有受访者均在日常工作中使用 V4-Pro 做 agentic coding。52% 认为 V4-Pro 可作为默认主力编码模型,39% 倾向认可,不到 9% 否定。反馈的主要问题包括低级错误、对模糊 prompt 的误解,以及偶发的过度思考。 (来源:BlockBeats)
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见
声明
。
赞赏
点赞
评论
转发
分享
评论
请输入评论内容
请输入评论内容
评论
暂无评论
热门话题
查看更多
#
Gate股票转仓功能上线
53.26万 热度
#
Circle股价重挫17%
416.29万 热度
#
预测世界杯葡萄牙VS克罗地亚
16.08万 热度
#
GateCard上线积分体系
11.96万 热度
#
非农数据倒计时
90.02万 热度
置顶
网站地图
V4-Pro内部评测:编码通过率逼近Opus4.5,52%内测者认可为默认模型