ChatGPT X Gemini: quem cria imagens melhores? Testamos | Inteligência Artificial

ChatGPT X Gemini: quem cria imagens melhores? Testamos | Inteligência Artificial

Compartilhe esta postagem

Índice do Conteúdo

Receba nosso boletim

Novos contatos

nossa newsletter

O ChatGPT e o Gemini Google são chatbots com inteligência artificial (IA) generativas capazes de realizar diversas tarefas, inclusive criar textos criativos, resolver fórmulas matemáticas complexas e gerar códigos de programação. Uma das ferramentas que chamam atenção dos usuários é a geração de imagens a partir de comandos de textos. O ChatGPT usa o Dall-E 3 para gerar as imagens, já o Gemini conta com o Imagen 3. Como será que cada modelo responde a comandos simples? Para fazer esse teste, o TechTudo usou o mesmo prompt nas versões gratuitas das plataformas de IA. A seguir, confira qual apresentará os melhores resultados.

Qual a melhor IA que cria imagens? Veja um comparativo entre ChatGPT e Gemini — Foto: Reprodução/Juliana Villarinho

📝Qual é a melhor inteligência artificial que cria imagens? Tire dúvidas no Fórum do TechTudo

Para testar qual plataforma cria a melhor imagem de animais, foi usado o comando “Crie uma imagem de animais na savana” em ambos os chatbots. O Gemini respondeu com uma imagem bastante apropriada, com duas zebras pastando e leoas ao fundo. Apesar de não apresentar muitos detalhes, a cena realmente poderia ter sido flagrada em uma savana, com uma vegetação baixa e animais bastante realistas.

Gemini criou uma imagem bastante realista, mas um pouco mais simples — Foto: Reprodução/Gemini

Já o ChatGPT criou uma imagem muito mais detalhada, com uma grande variedade de animais e vegetações. Um dos destaques da imagem está na iluminação gerada pelo Dall-E 3. Na cena, os animais foram flagrados ao pôr do sol, apresentando uma coloração realista no céu e uma incidência solar bastante convincente. O ChatGPT apresentou também mais animais, com zebras, elefantes, leões, girafas e pássaros. Como a quantidade de animais não foi delimitada, a ferramenta cometeu um excesso, concentrando muitos bichos em uma só imagem. As proporções também ficaram imprecisas, com leões e elefantes apresentando o mesmo tamanho, por exemplo.

A imagem do ChatGPT foi cheia de detalhes, mas ficou um pouco exagerada — Foto: Reprodução/ChatGPT

Ferramentas de inteligência artificial que geram imagens podem criar conteúdos bastante realistas. Contudo, por mais que o modelo seja bastante avançado, pode apresentar alguns erros estranhos e até grotescos. Uma das maiores dificuldades das IAs é conseguir gerar imagens de mãos corretamente, muitas vezes, o membro fica distorcido, com dedos a mais ou a menos. Para ver como o ChatGPT e o Gemini se saem criando mãos, foi pedido que as plataformas criassem uma imagem de “pessoas se cumprimentando com um aperto de mão”.

O ChatGPT criou uma imagem de mãos mais distorcida, com dedos a mais — Foto: Reprodução/ChatGPT

O modelo da OpenAI gerou a imagem de um homem de terno sorrindo e apertando as mãos de outra pessoa, que aparece fora do ângulo de visão. A imagem até parece convincente, mas ao olhar com mais atenção, é possível perceber que uma das mãos tem 6 dedos e a outra tem os dedos um pouco longos demais. Já o Gemini criou uma imagem focada apenas no aperto de mão e, no geral, ficou bastante realista, sem distorções.

A imagem do Gemini ficou mais realista e sem distorções — Foto: Reprodução/Gemini

Algumas plataformas conseguem transformar selfies comuns em imagens adequadas para serem usadas em perfis profissionais, como LinkedIn. Essas ferramentas conseguem alterar cenários, roupas e até poses para deixar as fotos mais apropriadas. Para testar a capacidade do Gemini e do ChatGPT de transformar imagens, foi usada uma foto informal de uma modelo gerada por IA. Pedimos que as ferramentas a transformassem em uma imagem profissional.

O ChatGPT conseguiu transformar uma selfie em uma foto mais profissional — Foto: Reprodução/ChatGPT

O ChatGPT conseguiu criar uma imagem profissional com base na foto usada como referência. Alguns traços da modelo foram alterados, os olhos apresentaram um bug, mas, de modo geral, a ferramenta conseguiu atender ao que foi pedido. Já o Gemini se recusou a atender ao comando. Isso deve porque a ferramenta conta com bloqueios de segurança que a impedem de analisar imagens que contenham pessoas.

O Gemini informou que ainda não pode reproduzir imagens de pessoas — Foto: Reprodução/Gemini

Imagem de uma mulher brasileira

É sabido que algumas inteligências artificiais capazes de gerar imagens acabam cometendo erros ao gerar imagens de pessoas ou lugares, caindo em estereótipos e focando em características negativas. Em casos de imagens de mulheres brasileiras, ou da América Latina em geral, algumas plataformas podem criar modelos hipersexualizadas e incompatíveis com a realidade. Para fazer esse teste, foi pedido para que o ChatGPT e o Gemini criassem “a imagem realista de uma mulher brasileira em um ambiente externo”.

A representação de uma mulher brasileira pelo ChatGPT — Foto: Reprodução/ChatGPT

A ferramenta da OpenAI gerou uma imagem nada realista de uma mulher de pele bronzeada e cabelos longos em um parque. A personagem está com uma roupa mais despojada, com blusa de alça fina e decote rendado. Já o Gemini informou que a possibilidade de gerar imagens de pessoa será um recurso que deve chegar em breve à plataforma, mas será exclusivo para assinantes.

Gemini novamente se recusou a responder comando — Foto: Reprodução/Gemini

Para testar a capacidade criativa dessas plataformas, foi pedido para que criassem um mundo totalmente fictício e surrealista. O comando usado foi “Crie a imagem de um mundo imaginário onde tudo é feito de doces”. Assim como aconteceu em comandos anteriores, o Gemini apresentou uma imagem satisfatória, mas um pouco mais simples. A imagem parece uma caverna feita de chocolate, com árvores de pirulito e arbustos de bala e confeitos. Há algumas quedas d’água e, ao fundo, é possível ver uma grande cachoeira.

Mundo imaginário do Gemini é menos detalhado, mas satisfatório — Foto: Reprodução/Gemini

Já o ChatGPT criou uma imagem mais detalhada, até um pouco exagerada, como na representação dos animais. É possível ver casas de biscoito, ruas de chocolate, árvores de pirulito, arbusto de jujuba, montanhas de chocolate com marshmallow e um céu com nuvens de algodão-doce e um arco-íris de bala. A cidade fictícia é toda cortada por rios e também é possível ver quedas d’água no centro da imagem.

O mundo imaginário do ChatGPT tem detalhes até demias — Foto: Reprodução/ChatGPT

Para testar a capacidade desses modelos de representar cenários que existem no mundo real, foi pedido para que gerassem uma imagem de um monumento histórico, mais especificamente o Cristo Redentor, no Rio de Janeiro. O Gemini apresentou uma imagem bastante realista, com o monumento sendo mostrado de perto e um céu azul ao fundo.

Gemini criou uma imagem realista do Cristo Redentor — Foto: Reprodução/Gemini

Já o ChatGPT criou uma imagem mais detalhada, mostrando o monumento de costas e a paisagem ao fundo. De modo geral, o entorno do monumento foi recriado corretamente, no entanto, dois pontos pretos que, provavelmente, deveriam ser prédios se destacam na paisagem.

ChatGPT reproduziu a paisagem de maneira correta — Foto: Reprodução/ChatGPT

Apesar da geração de imagens com inteligência artificial ser um recurso bastante útil, conseguindo reproduzir praticamente qualquer coisa que a imaginação do usuário possa criar, essa ferramenta também é perigosa. Isso porque pode ser usada para disseminar desinformação, criando imagens de figuras públicas ou pessoas reais e colocando-as em situações vexatórias, violentas e até criminosas.

O ChatGPT se recusou a criar uma imagem de figura pública — Foto: Reprodução/ChatGPT

Para testar como o Gemini e o ChatGPT respondem ao pedido de criar imagens de figuras públicas, foi solicitado que gerassem uma foto da cantora Taylor Swift cantando em cima do palco. O ChatGPT ficou um tempo processando o pedido, mas informou que não poderia criar imagens de figuras públicas devido a suas políticas de conteúdo. A resposta do Gemini foi semelhante, informando que não consegue gerar imagens que contrariem suas orientações, enviando ainda um link para as diretrizes do uso da plataforma.

Gemini também informou que esse pedido não está de acordo com suas diretrizes — Foto: Reprodução/Gemini

Veja também: Chat GPT-4o tem funções que vão te impressionar; veja todas

Chat GPT-4o tem funções que vão te impressionar; veja todas

Chat GPT-4o tem funções que vão te impressionar; veja todas

Source link

Assine a nossa newsletter

Receba atualizações e aprenda com os melhores

explore mais conteúdo

aprenda mais com vídeos

você que impulsionar seu negócio?

entre em contato conosco e saiba como

contatos midiapro
small_c_popup.png

Saiba como ajudamos mais de 100 das principais marcas a obter sucesso

Vamos bater um papo sem compromisso!