前OpenAI研究员发布翻页书原型:使用AI视频模型进行直接像素生成

robot
摘要生成中
根据Beating的监测,前OpenAI研究员Zain Shah及其团队发布了Flipbook,这是一个实验性原型,直接使用AI模型生成屏幕像素,取代了传统的网页技术如HTML和CSS。用户看到的每一“页面”都是由AI生成的图像,点击图像的任何区域都会生成一张新图像以供进一步探索。整个界面没有HTML代码、固定链接和预定义按钮,甚至文字也以像素形式呈现在图像中。视频模式基于开源的DiT(Diffusion Transformer)视频生成模型LTX Studio,由以色列公司Lightricks开发,优化为通过WebSocket以1080p、24fps的速度流式传输到用户屏幕,后台由Modal Labs的无服务器GPU提供支持。Shah提到,Flipbook目前的功能还很有限,团队正围绕视觉解释进行设计,但它展示了一个更大的方向:随着模型变得更加准确和具备状态性,它可能扩展为结构化的用户界面,包括编程场景。Shah曾在OpenAI从事AI和机器人研究,后来担任三星的创意技术专家,也是YC S13的校友。团队成员包括来自Humane和Slack的前工程师Eddie Jiao,以及前苹果工程师Drew O'Carr。
查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论