Ex-pesquisador da OpenAI lança protótipo Flipbook: pula o HTML e gera diretamente cada pixel usando um modelo de vídeo AI

De acordo com o monitoramento Beating, o ex-investigador da OpenAI Zain Shah e sua equipe lançaram o Flipbook, um protótipo experimental que gera diretamente pixels de tela usando modelos de IA, substituindo tecnologias tradicionais de páginas web como HTML e CSS. Cada “página” que o usuário vê é uma imagem gerada por IA, clicando em qualquer área da imagem gera uma nova imagem para continuar a exploração, toda a interface não possui código HTML, links fixos ou botões predefinidos, e até o texto é pixel na imagem.

O modo de vídeo é baseado no modelo de geração de vídeo DiT (Diffusion Transformer) de código aberto da empresa israelense Lightricks, o LTX Studio, que após otimizações pode transmitir em tempo real em 1080p a 24fps via WebSocket para a tela do usuário, com o backend usando GPU sem servidor da Modal Labs. Shah afirma que atualmente a funcionalidade do Flipbook é limitada, a equipe foca na interpretação visual, mas demonstra uma direção maior: à medida que os modelos se tornam mais precisos e com maior estado, no futuro podem se expandir para interfaces estruturadas, incluindo cenários de programação.

Shah trabalhou na OpenAI em pesquisa de IA e robótica, depois foi especialista em tecnologia criativa na Samsung, e também é ex-aluno do YC S13. Os membros da equipe incluem ainda o ex-engenheiro da Humane e Slack Eddie Jiao, e o ex-engenheiro da Apple Drew O’Carr.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar