O Google Labs apresentou recentemente o Whisk, uma ferramenta revolucionária que permite aos usuários criar imagens originais combinando várias fotos. Diferente de outras plataformas de geração de imagens que dependem exclusivamente de descrições textuais, o Whisk utiliza uma abordagem inédita ao permitir o upload de imagens para definir o assunto, o estilo e o cenário desejado, gerando resultados surpreendentes e únicos.
Como o Google Whisk funciona: um novo método de criação visual
Para utilizar o Whisk, o usuário precisa carregar de duas a três imagens. Essas imagens, então, são analisadas por Gemini, uma poderosa tecnologia de inteligência artificial do Google. O Gemini interpreta as imagens e gera descrições detalhadas dos elementos visuais presentes nelas. Essa etapa é crucial para que a IA compreenda as características essenciais das imagens e seja capaz de utilizá-las como base para a criação de algo novo.
Após a análise, essas descrições geradas pelo Gemini são processadas pelo Imagen 3, um modelo de geração de imagens avançado que o Google desenvolveu para criar composições visuais únicas. O resultado final é uma nova imagem que mistura o conteúdo de todas as fotos carregadas, mantendo a essência de cada uma enquanto introduz novas combinações criativas.
Por exemplo, um usuário pode carregar uma foto de um gato, uma cena de nenúfares e um estilo brilhante. O Whisk então usa essas entradas para gerar uma imagem inovadora de uma criatura fantástica descansando em um lago, misturando os elementos de forma harmoniosa. Embora a IA capture a essência de cada foto, ela não tenta replicá-las de forma exata, o que permite ao usuário explorar novas possibilidades criativas e visuais.
Se o resultado gerado não estiver completamente alinhado com a visão do usuário, o Whisk oferece a possibilidade de refiná-lo. Isso é feito ajustando os prompts subjacentes ou fornecendo novas instruções sobre aspectos específicos, como a cor predominante, padrões de estilo ou até mesmo o foco em certos elementos da cena. Dessa forma, o processo criativo se torna altamente interativo, permitindo múltiplas tentativas até que a imagem final esteja de acordo com as expectativas do usuário.
Disponibilidade e acesso ao Google Whisk
Atualmente, o Whisk está disponível gratuitamente para usuários dos Estados Unidos por meio do link labs.google/whisk. A plataforma permite que você experimente a criação de imagens geradas por IA e baixe suas criações diretamente para seu dispositivo. O Google está incentivando os usuários a fornecerem feedback, o que ajudará a aprimorar a ferramenta ao longo do tempo e expandir suas funcionalidades.