Como usar o ChatGPT Imagens 2.0? Teste prático de menu de carne bovina, capa de revista, efeito de divulgação em múltiplos idiomas

robot
Geração de resumo em curso

OpenAI lança a ferramenta de imagens do ChatGPT 2.0, focada em capacidades poderosas de layout complexo e processamento de textos multilíngues (incluindo chinês), este artigo apresenta uma introdução completa às funcionalidades do Images 2.0, suas características, planos gratuitos e pagos, além de resultados de testes de geração de imagens.

O que é o ChatGPT Images 2.0? Conheça suas principais funções e características!

Uma ferramenta de geração de imagens AI capaz de competir com o Gemini Nano Banana 2 chegou? A OpenAI anunciou o lançamento do ChatGPT Images 2.0, alimentado pelo novo modelo GPT Image 2, que destaca-se pela excelente capacidade de selecionar, organizar e revelar informações em imagens. A seguir, as três principais características do ChatGPT Images 2.0:

Processamento avançado de layout e textos multilíngues

Primeiramente, uma característica bastante evidente é a significativa melhoria na capacidade de layout e processamento de textos multilíngues do ChatGPT Images 2.0.

Segundo a mídia especializada Techcrunch, as ferramentas de geração de imagens AI anteriores geralmente utilizavam modelos de difusão, que frequentemente enfrentavam dificuldades na escrita de textos. O ChatGPT Images 2.0 consegue apresentar detalhes minuciosos como textos pequenos, ícones e interfaces de usuário com alta precisão.

A OpenAI afirma que o Images 2.0 apresenta avanços notáveis no processamento de línguas que usam alfabetos não latinos, incluindo chinês, japonês, coreano, hindi e bengali, podendo gerar esses textos com altíssima clareza nas imagens.

Fonte: Exemplos oficiais gerados pelo ChatGPT Images 2.0 da OpenAI

Capacidade de raciocínio e busca na internet renovadas

Além do processamento de layout e textos multilíngues, o ChatGPT Images 2.0 oferece uma nova capacidade de raciocínio, podendo buscar informações na internet em tempo real para ajudar na geração de imagens. O banco de dados do modelo é atualizado até dezembro de 2025, auxiliando na criação de conteúdos relacionados a eventos recentes.

Fonte: Exemplos oficiais gerados pelo ChatGPT Images 2.0 da OpenAI

Suporte a resolução 2K e proporções variadas

O ChatGPT Images 2.0 suporta geração de imagens com resolução de até 2K e oferece uma gama mais ampla de proporções, desde 3:1 para imagens panorâmicas até 1:3 para imagens verticais.

O responsável pela pesquisa da OpenAI, Boyuan Chen, afirmou que a arquitetura do Images 2.0 foi completamente redesenhada, sendo um modelo universal que, com comandos de texto simples, consegue lidar com mudanças de perspectiva em estilo 3D e raciocínio espacial complexo.

Funcionalidades dos planos gratuitos e pagos do ChatGPT Images 2.0

Dinheiro fala? Usuários de diferentes níveis de assinatura do ChatGPT Images 2.0 têm acesso a funcionalidades distintas, resumidas assim:

  • Usuários gratuitos: Atualmente podem usar o modelo básico ImageGen 2.0 para tarefas padrão de geração de imagens. A versão básica já inclui várias melhorias essenciais, como melhor aderência às instruções, efeitos de renderização de texto mais robustos, suporte multilíngue e maior variedade de proporções.
  • Usuários do ChatGPT Plus, Business e Enterprise: Esses assinantes podem ativar o novo modo de raciocínio. Nesse modo, o gerador de imagens do chatbot usa busca na internet, cria diagramas visuais a partir de arquivos enviados pelo usuário e realiza raciocínio estrutural antes de gerar as imagens. É possível gerar até 8 imagens simultaneamente, garantindo consistência nos personagens, objetos e estilos de cada cena.
  • Usuários Pro: Têm acesso ao modelo avançado ImageGen Pro. Embora a OpenAI ainda não tenha detalhado exatamente as diferenças entre Pro e o modo de raciocínio, para empresas, essa funcionalidade pode ser vista como uma atualização de recursos, útil para tarefas que exigem fatos precisos, conversão de documentos internos em diagramas explicativos ou manutenção de consistência visual em múltiplos ativos.
  • Desenvolvedores de API: Agora podem integrar o modelo gpt-image-2, suportando alta resolução e configurações flexíveis de proporções.

Testes do ChatGPT Images 2.0: menus, revistas, gráficos explicativos

Como o desempenho real do ChatGPT Images 2.0 corresponde às promessas da OpenAI? Vamos testar.

Teste de menu de restaurante de carne bovina

Um editor do “Crypto City” testou a versão gratuita do ChatGPT, criando um menu de carne bovina taiwanês com uma instrução simples: “Por favor, gere um menu focado em pratos de carne bovina taiwanesa, usando chinês tradicional, incluindo nomes, preços e imagens de cada prato.”

A seguir, o resultado gerado:

Fonte: Gerado pelo ChatGPT Images 2.0

Para o conteúdo gerado na versão gratuita, o resultado parece razoável à primeira vista, mas ao observar com mais atenção, nota-se que o Images 2.0 ainda apresenta erros de escrita ao lidar com caracteres tradicionais chineses mais complexos, o que talvez seja melhorado na versão paga.

Além disso, o resultado aproxima-se dos preços de carne bovina em Taipei e permite uma porção extra gratuita para consumo no local.

Porém, se o menu for para impressão, o ideal é converter as imagens fornecidas pelo ChatGPT Images 2.0 em arquivos vetoriais (como EPS, .ai do Adobe Illustrator ou PDF) e usar cores CMYK, o que é mais adequado para impressão. Embora as gráficas possam aceitar JPG ou PNG, se você tiver requisitos elevados de qualidade, será mais difícil ajustar o resultado final.

Teste de capa de revista de tecnologia

Em seguida, testamos uma capa de revista de ficção científica, usando a mesma revista “Crypto City” para verificar o processamento de layouts complexos. A instrução foi: “Por favor, gere uma capa de revista de tecnologia em chinês tradicional, com o nome ‘Crypto City’, tema ‘Encontro entre Blockchain e IA’, incluindo título, volume, código de barras e data de validade na parte superior, com todos os textos claros e alinhados de forma profissional.”

A seguir, o resultado:

Fonte: Gerado pelo ChatGPT Images 2.0

Este resultado é semelhante ao anterior, parece bom à primeira vista, mas ao analisar detalhes, ainda há falhas na escrita de caracteres chineses complexos. Além disso, a fonte da capa lembra bastante a “Jin Xuan Ti” da Justfont, uma fonte taiwanesa, levantando dúvidas sobre possível licença.

Essa questão também foi levantada pelo “Crypto City” na época do lançamento do Nano Banana Pro.

  • Reportagem relacionada: Teste do Nano Banana Pro: avanços nos caracteres chineses! Mas surgem dúvidas sobre direitos de animação e fontes

Teste de gráficos explicativos multilíngues

“Crypto City” testou um gráfico de causa de terremoto em chinês tradicional, japonês e coreano, com textos multilíngues complexos que foram renderizados de forma geral com sucesso. Na disposição, diferentes cores foram usadas para distinguir os idiomas, embora ao olhar de perto alguns caracteres chineses, coreanos ou kanjis mais complexos ainda apresentem problemas de borrão.

A seguir, o resultado:

Fonte: Gerado pelo ChatGPT Images 2.0

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar