Em maio, a Google anunciou uma funcionalidade Ask Photos para o Google Fotos. Esta funcionalidade, que é alimentada pelo Gemini, permite-lhe pesquisar fotografias utilizando linguagem natural. Agora, parece que esta funcionalidade do Google Fotos já chegou a alguns utilizadores.
Grande novidade no Google Fotos já chegou a alguns! Já viu?
O 9to5Google e o especialista em Android Mishaal Rahman detectaram este lançamento. No entanto, parece que a funcionalidade só está a chegar a alguns utilizadores que se inscreveram numa lista de espera. Também parece que esta opção está a chegar como uma alteração do lado do servidor. Assim não importa qual a versão do Google Fotos que tem.
A funcionalidade Ask Photos ou Perguntar às fotografias permite-lhe pesquisar fotografias utilizando linguagem simples. Na altura da revelação da funcionalidade, a Google deu exemplos como “Qual é o número da minha matrícula?” e “Mostre-me a melhor fotografia de cada parque nacional que visitei”. Também lhe permite adicionar pesquisas por pessoas queridas, o que, em teoria, constitui uma poderosa ferramenta de pesquisa.
Não é a primeira vez que vemos a funcionalidade de pesquisa semântica em fotografias, uma vez que a ASUS oferece esta funcionalidade na sua aplicação de galeria. No entanto, esta seria uma grande expansão desta tecnologia. É que o Google Fotos está disponível na grande maioria dos telemóveis Android. Seria também um passo em frente em termos de complexidade em comparação com a solução da ASUS, devido à tecnologia de reconhecimento facial e à inteligência Gemini da Google.
Outra grande novidade a caminho
Mas para além disto há outra novidade interessante já que parece que o Google Fotos vai começar a falar sobre as suas memórias.
As linhas de código encontradas no Google Fotos indicam que o Gemini será utilizado para recapitulações. Mas, mais importante, parece que a IA também será capaz de as narrar. Felizmente, parece que a funcionalidade se pode ativar e desativar, pelo que os utilizadores podem escolher se a incluem ou não. Será interessante ver se esta mesma funcionalidade fica em todas as imagens geradas pelo Google Gemini ou se será apenas para as fotografias da câmara.
A principal questão diz respeito à forma como estas recapitulações vão realmente soar e que voz se utiliza. A geração de voz de IA melhorou muito nos últimos anos. Assim será interessante ver a escolha da voz.
No entanto, a grande questão é saber onde é que a Gemini vai buscar a informação para a narração. É possível que os dados sejam recolhidos a partir das próprias imagens ou de outros serviços da Google, mas, nesta altura, tudo não passa de uma conjetura.