Pesquisadores dos EUA criam IA por menos de US$ 50

Pesquisadores dos EUA criam IA por menos de US$ 50

Compartilhe esta postagem

Índice do Conteúdo

Receba nosso boletim

Novos contatos

nossa newsletter

Cálculos passaram pelo processo de “ajuste fino supervisionado”, método mais barato de aprendizado por reforço em larga escala

iStock-2012883461-1920x1080
IA foi treinada por processo conhecido como “destilação” (Imagem: WANAN YOSSINGKUM/iStock)

Compartilhe esta matéria

Contrariando as expectativas de investimentos milionários, um modelo de inteligência artificial foi treinado por menos de US$ 50 (R$ 288 pela cotação atual) por pesquisadores das Universidades de Stanford e de Washington, nos Estados Unidos

Conhecido como s1, o modelo é baseado em computação em nuvem e apresentou desempenho semelhante ao o1 da OpenAI e o R1 da DeepSeek nos testes de habilidades matemáticas e de cálculo. As informações são do site Tech Crunch.

A nova tecnologia utilizou o mesmo processo adotado no mês passado por pesquisadores da universidade de Berkeley, que criaram o Sky-T1 — um modelo de cálculo de IA — por cerca de US$ 450 (R$ 2,5 mil).

Pesquisadores dos EUA criam IA por menos de US$ 50
Vista aérea da Universidade de Stanford, na Califórnia (Imagem: Wirestock/iStock)

Leia Mais:

Uma IA imitando outra IA?

O protótipo foi feito a partir de um sistema do laboratório chinês de IA Qwen, de propriedade do Alibaba, que pode ser acessado gratuitamente na internet. Foram usados dados de mais de 1.000 perguntas e respostas disponíveis no Gemini 2.0 Flash Thinking, a IA experimental do Google.

A ferramenta da big tech está disponível de forma gratuita, mas a empresa não permite engenharia reversa para criar serviços com a IA. A reportagem do Tech Crunch procurou o Google para comentar o projeto dos pesquisadores, mas ainda não recebeu um retorno.

gemini 2.0
IA do Google foi usada para fornecer dados em novo modelo (Imagem: FilipArtLab / Shutterstock.com)

A técnica é conhecida como “destilação”, um processo que extrai as capacidades de “raciocínio” de outro modelo de IA por meio do treinamento em suas respostas. Além disso, os cálculos passaram por um “ajuste fino supervisionado” — ou SFT —, um método mais barato de aprendizado por reforço em larga escala.

Os autores explicam que o modelo ficou pronto em menos de 30 minutos usando 16 GPUs Nvidia H100. O sistema foi ensinado a “esperar” antes de concluir os pensamentos, o que permitiu uma espécie de verificação duplicada e respostas mais precisas, segundo o artigo. Os dados usados estão disponíveis no GitHub.


Bruna Barone

Colaboração para o Olhar Digital

Jornalista formada pela Faculdade Cásper Líbero

Ana Luiza Figueiredo

Redator(a)

Ana Luiza Figueiredo é repórter do Olhar Digital. Formada em Jornalismo pela Universidade Federal de Uberlândia (UFU), foi Roteirista na Blues Content, criando conteúdos para TV e internet.


Source link

Assine a nossa newsletter

Receba atualizações e aprenda com os melhores

explore mais conteúdo

aprenda mais com vídeos

você que impulsionar seu negócio?

entre em contato conosco e saiba como

contatos midiapro
small_c_popup.png

Saiba como ajudamos mais de 100 das principais marcas a obter sucesso

Vamos bater um papo sem compromisso!