今日预测-6月底哪家公司的AI模型最好?


首先提个小建议,在预测选项中每个公司后面标注上每家公司对应的AI模型会更好, @predictdotfun 有些用户不太熟各家公司的模型名字
这是一个今天刚新上的预测事件,如果你也对这个事件感兴趣,可以跟着我的思路一起来看看
首先我们拆解下结算规则
这里比的哪个AI模型最好,比的是一个叫Chatbot Arena网站上的LLM排行榜的得分,另外有个关键点是,规则中还标注了一点,排行榜关于“style control”标签,要选“off”,得出的结果见“图2”,你也可以直接通过这个网页查看
另一个注意点就是结算时间6月30日
从当前的结果显示来看,Claude确实以1499的分数位列第一,甚至于前三名都是他们的
但如果具体点看会发现,第四名Gemini距离第一名分数差距并不大,也就17分,更何况这个分数其实是个区间分数,也即其实第四名和第三名几乎无差别
那么这个积分十几分、几十分的差距是否代表绝大的进步呢,我完全不懂技术,好在这种技术词汇本身AI就很擅长
从Grok以及Gemini几个给我反馈的结果来看,这个分叫Elo分,十几分并不是“巨大进步”,而仅仅是相对微小的优势
那么从当前预测选项中第一名“Anthropic-Claude”以高达83%碾压性概率,我认为里面可能存在错配空间
为了进一步验证这个可能性,我再问了AI本月几个AI巨头是否有发布新AI模型的迹象
得出的结果进一步验证了我的猜测
在这个六月很可能会是今年AI圈竞争最惨烈的一个月,几个AI巨头均有可能发布新版本
谷歌的Gemini 3.5 Pro已经蓄势待发,他们在5月只发布了Gemini 3.5 Flash,更强的大脑Gemini 3.5 Pro还捂着没发,据说极大概率将在本月发布
同样OpenAI的GPT-5.6在本月发布的呼声也极高。
基于以上信息,我的操作是,我立马分别买了点Google、OpenAI两者的“是”份额,主要是他们价格确实很低,盈亏比很高
在当前这种低价,后续我还会长期挂着两者“是”的买入限价单
等到月中如果真的发生几大AI巨头大战的时候,届时这个排名就会剧烈波动,大概率会有不错的盈利空间,我会考虑先出部分保本的情况下让盈利去跑剩余的
以上就是我对本次Predict“6月底哪家公司的AI模型最好?”,希望对你有所启发
ANTHROPIC-3.05%
GOOGLX-2.14%
OPENAI-2.12%
post-image
post-image
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论