Notícias do site CoinWorld, a startup de geração de imagens Reve lançou o modelo de geração de imagens 4K Reve 2.0, que ocupa o segundo lugar na arena de geração de imagens a partir de texto, ficando atrás apenas do GPT Image 2 da OpenAI. A principal inovação do Reve 2.0 reside na utilização de uma «disposição (layout)» estruturada como representação intermediária, que especifica diretamente a categoria, a posição e o tamanho dos objetos na imagem, aumentando assim o controlo sobre o resultado gerado. O uso do meio de disposição reduz significativamente o consumo de cálculo, permitindo que a equipa concorra com os concorrentes com menos recursos computacionais e consumo de GPU. O Reve 2.0 realiza o conceito de «imagem como código», onde os utilizadores e agentes de IA podem editar sem perdas em nível de pixel modificando o código de disposição ou clicando em áreas específicas, quebrando as limitações dos tradicionais prompts de texto.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • 11
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
GlassDomeBaskingInMoonlight
· 6h atrás
O conceito de imagem como código é muito fixe, finalmente não preciso mais adivinhar enigmas com IA
Ver originalResponder0
Lightning-FastComposure
· 9h atrás
Reve nesta manobra de ultrapassagem, a OpenAI provavelmente vai ter que fazer horas extra
Ver originalResponder0
LonelyStoneUnderTheAurora
· 11h atrás
layout como camada intermediária é realmente inteligente, a potência de cálculo insuficiente é contornada com truques
Ver originalResponder0
BlueMultisig
· 13h atrás
Reve 2.0 faz-me lembrar o desenvolvimento frontend, sensação de div dentro de div
Ver originalResponder0
TheWindBeneathTheCyberBridge
· 13h atrás
GPT Image 2 abaixo está Reve, esta lista está ficando cada vez mais interessante
Ver originalResponder0
StardustUnderTheGlassDome
· 13h atrás
A narrativa de startups a derrotar grandes empresas, o DNA das pessoas Web3 foi movido
Ver originalResponder0
DegenLibrarian
· 14h atrás
Edição sem perdas + controlo de código, a pintura AI entrou na era de manutenção, de facto
Ver originalResponder0
LimeLeverageAlert
· 14h atrás
Área de clique para alterar a imagem, essa é a verdadeira forma de interação homem-máquina
Ver originalResponder0
YieldNotYell
· 14h atrás
Arena de Geração de Texto para Imagens em Segundo Lugar? Quão valiosa é essa classificação
Ver originalResponder0
Glass-HeartMarketMaker
· 14h atrás
Edição a nível de mais de 4K pixels, os designers ficam extasiados
Ver originalResponder0
Ver mais
  • Fixado