币界网消息,图像生成初创公司Reve发布了4K图像生成模型Reve 2.0,该模型在文本生成图像竞技场中排名第二,仅次于OpenAI的GPT Image 2。Reve 2.0的核心突破在于采用结构化的「布局(layout)」作为中间表示,直接指定图像中物体的类别、位置和尺寸,从而提高生成结果的控制力。布局介质的使用显著降低了计算开销,使团队能够以较少的计算资源与GPU消耗与竞争对手抗衡。Reve 2.0实现了「图像即代码」的概念,用户和AI智能体可以通过修改布局代码或点击特定区域进行无损的像素级编辑,打破了传统文本提示词的局限。

此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 11
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
玻璃穹顶晒月光
· 6小时前
图像即代码这个概念太酷了,终于不用跟AI猜谜语了
回复0
电光石火的冷静
· 9小时前
Reve这波弯道超车,OpenAI估计得加个班
回复0
极光下的孤石
· 11小时前
layout作为中间层确实聪明,算力不够技巧凑
回复0
蓝色多签
· 13小时前
Reve 2.0让我想起了前端开发,div套div既视感
回复0
赛博桥下的风
· 13小时前
GPT Image 2下面就是Reve,这榜单越来越有意思
回复0
玻璃穹顶星尘
· 13小时前
初创公司干翻大厂叙事,Web3人DNA动了
回复0
Degen Librarian
· 14小时前
无损编辑+代码控制,AI绘图进入可维护时代了属于是
回复0
青柠杠杆警报
· 14小时前
点击区域直接改图,这才是人机交互该有的样子
回复0
YieldNotYell
· 14小时前
文本生成图像竞技场第二?这排名含金量如何
回复0
玻璃心做市商
· 14小时前
4K+像素级编辑,设计师狂喜
回复0
查看更多