Tem muita IA boa por aí criando imagem realista. A diferença é que agora não se trata mais de acertar a anatomia ou corrigir um fundo esquisito. O jogo mudou. O que a gente quer ver é qual ferramenta consegue entregar algo com textura, profundidade, equilíbrio de luz, expressão natural. Algo que pareça feito por um fotógrafo, não por um robô.
Nesse teste, coloquei duas IAs populares frente a frente. Uma é o ChatGPT, usando o gerador de imagem integrado. A outra é o Nano Banana (Gemini), da linha de produtos do Google. A ideia não é fazer briga de torcida. É olhar, comparar e entender qual delas manda melhor em imagem realista. Sem filtro e sem hype.
Campanha de moda editorial
Para testar na prática, usei uma foto minha e pedi para as duas IAs criarem uma versão realista, com base em um mesmo prompt bem descritivo.
Prompt:
Retrato ultra-realista de uma mulher, cabelo vermelho, na altura dos ombros e enrolado, expressão confiante e séria. Veste um terno de linho rosa claro com uma camisa neutra por dentro e elegantes óculos escuros. Mãos casualmente nos bolsos, em pé, em um cenário urbano moderno com prédios de vidro espelhado e palmeiras ao fundo. Luz natural intensa, sombras fortes e definidas, atmosfera elegante. Capturado com DSLR, lente 50mm f/2.0, plano médio (cintura para cima), ângulo ligeiramente baixo para maior presença. Textura de pele realista, tons quentes naturais, detalhes de tecido enfatizados. Estilo editorial de campanha de moda.
Imagem original

Nano Banana

ChatGPT

Visualmente, o Nano Banana entregou um resultado mais fiel. A textura da pele ficou mais natural, o tom da roupa bate melhor com a proposta do prompt e a expressão mantém uma identidade próxima da minha.
Já o ChatGPT, apesar de compor bem o cenário e manter a pose, envelheceu bastante a personagem. A imagem parece comigo de longe, mas não transmite a mesma presença.
O problema aqui não é a qualidade da imagem. As duas são tecnicamente boas. O que pesa mesmo é o quanto a imagem final ainda guarda algum traço da pessoa original. E nisso, o Nano Banana saiu na frente.
Bilionária
Prompt
Retrato de uma mulher bilionária estilosa, com cabelos vermelhos, na altura dos ombros e enrolados, traços faciais marcantes e expressão intensa. Vestindo um elegante terno roxo com camisa branca e sem gravata, relógio de pulso luxuoso visível no pulso direito. Fundo de estúdio com atmosfera minimalista e escura. Iluminação dramática de Rembrandt, luz lateral destacando metade do rosto com sombras profundas e cinematográficas. Capturado com câmera DSLR full-frame, lente 85 mm f/1.4, baixa profundidade de campo, foco nítido no rosto e nas mãos. Alto contraste, tons profundos, textura de pele realista, granulação sutil. Estilo editorial de revista, fotografia de moda Vogue/GQ.
Nano Banana

ChatGPT

O Nano Banana entregou uma imagem com excelente acabamento. A iluminação está no ponto, a textura da pele é realista, o olhar tem profundidade e, mais uma vez, o rosto ficou mais próximo do meu. A sensação é de que a IA entendeu o conceito e usou referências fotográficas reais como base. O terno está bem estruturado, a pele tem volume e a expressão conversa com o ambiente.
O ChatGPT, por outro lado, acertou em cheio no estilo de editorial de revista. A composição é forte, a iluminação dramática com sombra lateral cria uma atmosfera elegante, e a pose com a mão no rosto tem impacto. Mas a semelhança com a imagem original ficou mais distante. O formato do rosto mudou, a expressão ficou mais rígida e até os traços da boca parecem de outra pessoa.
Do ponto de vista técnico, as duas imagens são muito boas. Mas quando o critério é fidelidade ao rosto original, o Nano Banana ainda entrega um resultado mais consistente. Parece que ele está mais atento aos detalhes que fazem uma imagem parecer “você” de verdade, não só uma personagem dentro do prompt.
Corporativo
Prompt:
Retrato corporativo ultrarrealista de uma mulher, traços latino-americanos, pele negra média, cabelos vermelhos na altura dos ombros e enrolados, expressão pensativa e séria. Sentada em um sofá de couro escuro em uma sala de estar profissional, ligeiramente inclinado para a frente, com uma mão apoiada no rosto e a outra perto de um laptop no colo. Vestindo um blazer azul, camiseta preta lisa e calça preta justa. Fundo com elegantes painéis de madeira escura, atmosfera corporativa. Iluminação ambiente interna suave e quente, contraste cinematográfico. Capturado com DSLR, lente 50mm f/1.8, plano médio incluindo sofá e joelhos, ângulo ligeiramente lateral. Textura de pele realista, tons quentes, granulação sutil. Fotografia corporativa editorial, estilo revista de negócios.
Nano Banana

ChatGPT

A imagem gerada pelo Nano Banana trouxe um olhar profundo, uma pose natural e um resultado que lembra muito mais a minha expressão real. A textura da pele continua precisa, o ambiente tem coerência e a iluminação conversa bem com o tom da cena. Mesmo nos pequenos detalhes, como a mão no rosto ou a direção do olhar, dá pra notar uma intenção estética mais refinada.
Já o resultado gerado pelo ChatGPT não ficou ruim, mas parece que a IA se afastou ainda mais da minha imagem original. O rosto perdeu definição, o olhar ficou mais disperso e a cena inteira parece uma reconstrução distante, como se fosse outra pessoa em um cenário parecido. O conjunto não tem o mesmo peso visual e nem a mesma força emocional.
Camponesa
Dessa vez, testei com um prompt mais simples. Pedi que a imagem retratasse uma mulher com roupa de camponesa em um milharal ao entardecer, com enquadramento de corpo inteiro. Nada muito elaborado, só uma cena com atmosfera leve e natural.
Nano Banana

ChatGPT

O resultado do Nano Banana me surpreendeu de novo. A composição tem mais respiro, com espaço em volta, tons quentes do pôr do sol e uma construção visual que respeita bem o cenário descrito. A pose é suave, a expressão tem presença e, mesmo com menos detalhes técnicos no prompt, ele entendeu bem a proposta.
A imagem feita pelo ChatGPT também ficou bonita. O rosto está mais visível, o figurino tem boa definição e a luz está bem trabalhada. Mas aqui apareceu um novo padrão. O rosto gerado ficou muito infantilizado, como se fosse uma versão mais jovem ou até caricata. Nas imagens anteriores, o efeito foi o contrário, com traços mais envelhecidos. Dessa vez, parece que ele exagerou na suavização facial.
Palestra
Para encerrar, fiz mais um teste com um prompt direto. Pedi que a imagem mostrasse uma mulher com vestido preto elegante, em um palco, palestrando em um evento sobre Bitcoin. Pedi também para a câmera estar próxima ao rosto, mas ainda mostrando o corpo todo.
Nano Banana

ChatGPT

O resultado do Nano Banana foi ótimo. A imagem tem riqueza de detalhes, iluminação bem construída, o cenário do evento é convincente e o rosto ficou natural. Ele conseguiu transmitir presença de palco, e mesmo com um prompt menos técnico, entregou uma imagem com bastante realismo.
Já a imagem feita pelo ChatGPT teve um resultado mais artificial. Não chega a estar errada, mas o rosto ficou estranho. Parece plastificado, quase como se tivesse sido colado no corpo. Faltam sombras reais, textura de pele, expressão viva. Lembra mais o estilo de um manequim 3D do que de uma pessoa de verdade.
Esse último teste reforçou o que os outros já vinham mostrando. Quando o assunto é realismo facial, textura e presença, o Nano Banana entrega imagens com mais personalidade e cuidado nos detalhes. O ChatGPT ainda acerta em muitos aspectos de composição, mas escorrega feio quando o rosto vira o foco da cena.
Leia mais:
ChatGPT ajuda mulher a ganhar na loteria e ela doa tudo para caridade
5 prompts de ChatGPT que desbloqueiam o aprendizado real
Um site, várias IAs: compare ChatGPT, Claude, Gemini e mais de uma só vez
Fique por dentro das notícias mais quentes do mercado de IA: entre no nosso canal no WhatsApp.