Google lança novo modelo de IA; saiba como usar

joabe antonio de oliveira
dezembro 12, 2024

Compartilhe esta postagem

Receba nosso boletim

O Google lançou, nesta quarta-feira (11), o “Gemini 2.0”. A ferramenta é o novo modelo de IA (Inteligência Artificial) da empresa, que ajuda os usuários a criarem textos, imagens e até falas. O Primeira Página te explica as mudanças, como utilizar e quais são as intenções práticas da ferramenta.

Por ora, a versão experimental da IA está disponível por meio da API Gemini e das plataformas de desenvolvedores de IA do Google. Os recursos de geração de áudio e imagem serão liberados apenas para mais usuários apenas em janeiro.

Há um ano, a Google lançou a ferramenta “Gemini”. A IA é capaz de realizar tarefas que exigem mais capacidade de raciocínio. A inteligência artificial ajuda programadores com códigos complexos quanto estudantes com a lição de casa, por exemplo. O modelo também contribui para oferecer respostas à pesquisas de usuários na aba de “busca” do próprio site.

Agora, na versão “tunada”, a IA utiliza raciocínio avançado e contexto expandido para atuar como um assistente de pesquisa, capaz de explorar temas complexos e criar relatórios detalhados. A ferramenta já está disponível para o Gemini Advanced.

Conforme comunicado da BigTech, o novo modelo de IA foi desenvolvido com hardware personalizado. “O Gemini 1.0 representou um avanço importante na forma como organizamos e entendemos informações. Com o Gemini 2.0, avançamos ainda mais, tornando essas informações mais úteis e impactantes. Mal posso esperar para ver tudo o que essa nova era pode trazer”, destacam na nota.

Na prática, o que o Gemini 2.0 Flash faz?

O Gemini 2.0 Flash é uma evolução do 1.5 Flash. Segundo a Google, a nova versão oferece desempenho ainda mais robusto e, em muitos casos, supera o 1.5 Pro em padrões de desempenho importantes, mantendo o dobro de velocidade. Entre os novos recursos, estão:

suporte a entradas multimodais, como imagens, vídeos e áudio;
geração de saídas multimodais (inteligência artificial gerar informações em vários formatos), incluindo imagens nativas combinadas com texto e áudio multilíngue ajustável por meio de texto-para-fala;
a geração de áudio é outro recurso destacado pelo Google. O modelo pode narrar texto usando uma das oito vozes “otimizadas” para diferentes sotaques e idiomas.

Como ter acesso?

A partir desta quinta, os usuários do Gemini do mundo inteiro poderão acessar a versão otimizada para chat do 2.0 Flash Experimental. Basta escolher a opção no menu de modelos, disponível para computadores e dispositivos móveis.

Source link