IA acelera em desempenho e custo despenca, mostra AI Index 2025

Apesar dos saltos, raciocínio complexo, como em planejamento e matemática, ainda desafia IA. Mais: Google lança dev studio para IA, guia de testes para Node.js e Shopify torna IA skill obrigatória.

abr 12, 2025

Gráfico de linhas mostrando a porcentagem de publicações de IA em Ciência da Computação por região entre 2013-2023. A região Leste Asiático e Pacífico lidera com crescimento de 27% para 34,5%, enquanto Europa e América do Norte apresentam quedas para 18,1% e 10,3%, respectivamente. Ásia do Sul cresceu para quase 10%. Oriente Médio e Norte da África mantiveram-se estáveis em torno de 5%, enquanto América Latina e África Subsaariana permanecem abaixo de 2% e 1%. — Região da Ásia Oriental e Pacífico lidera produção de publicações acadêmicas em IA em Ciência da Computação. Fonte: AI Index Report.

A oitava edição do AI Index Report, divulgado pela Universidade Stanford agora em abril de 2025, revela o domínio que a Inteligência Artificial já ganhou no mundo, seja na tecnologia, na ciência ou nos governos. O documento de 456 páginas, considerado uma das fontes mais confiáveis sobre o tema, aponta não apenas saltos de desempenho, mas também uma maior democratização da tecnologia.

O relatório destaca avanço notável nas capacidades técnicas dos sistemas de IA. Em apenas um ano, modelos avançados registraram ganhos em benchmarks críticos. No SWE-bench, focado em problemas reais de programação, a taxa de resolução saltou de 4,4% em 2023 para 71,7% em 2024. Melhorias também foram observadas no MMMU (+18,8 pontos percentuais) e no GPQA (+48,9 pp).

Talvez o dado mais revelador para desenvolvedores seja a queda acentuada nos custos. O preço para consultar modelos com desempenho equivalente ao GPT-3.5 despencou mais de 280 vezes entre novembro de 2022 e outubro de 2024 — de US$ 20 para apenas US$ 0,07 por milhão de tokens. A redução drástica coincide com um período em que o número de startups de IA generativa recém-financiadas quase triplicou, segundo um dos destaques do relatório.

A eficiência também deu um salto. Em 2022, o menor modelo a ultrapassar 60% no benchmark MMLU foi o PaLM com seus 540 bilhões de parâmetros. Em 2024, o Phi-3-mini da Microsoft atingiu o mesmo patamar com apenas 3,8 bilhões — uma redução de 142 vezes no tamanho necessário para performance similar.

No hardware dedicado à IA, o relatório identifica melhorias anuais de 43% em desempenho (medido em operações de ponto flutuante de 16 bits), queda de 30% nos custos e aumento de 40% na eficiência energética. Estas tendências estão derrubando barreiras para desenvolvedores e empresas integrarem a tecnologia em suas operações cotidianas.

O cenário competitivo também mudou drasticamente. A diferença de performance entre o melhor modelo e o décimo colocado (medida pelo Elo score no Chatbot Arena) caiu de 11,9% para apenas 5,4% em um ano. A distância entre os dois primeiros colocados encolheu ainda mais — de 4,9% para meros 0,7%.

Geograficamente, a disputa intensificou-se. EUA continuam na liderança com 40 modelos notáveis lançados em 2024, contra 15 da China e três da Europa. No entanto, a diferença qualitativa entre modelos americanos e chineses diminuiu em benchmarks importantes, e com a Ásia produzindo mais publicações acadêmicas que outros continentes. O investimento privado nos EUA alcançou US$ 109,1 bilhões (quase 12x o da China), enquanto França (€109 bilhões), Arábia Saudita (US 100 bilhões) e outros países anunciaram pacotes nacionais substanciais.

O impacto da IA já ultrapassa os laboratórios. Nos EUA, 78% das empresas relatam usar IA — um salto de 23 pontos percentuais em relação a 2023. A aprovação de dispositivos médicos baseados em IA pela FDA aumentou de 6 em 2015 para 223 em 2023. Robôs autônomos da Waymo e Baidu já realizam centenas de milhares de corridas semanais, e dois prêmios Nobel e um Turing Award homenagearam trabalhos relacionados à IA em 2024.

Apesar dos avanços, o relatório também aponta preocupações. O treinamento de modelos de ponta demanda computação crescente — dobrando a cada cinco meses — com emissões de carbono que preocupam. O Llama 3.1-405B, por exemplo, gerou estimadas 8.930 toneladas de CO₂ em seu treinamento, equivalente à pegada de carbono de um americano médio por quase 500 anos.

A confiança pública permanece como um ponto de atenção, com casos de viés, desinformação e deepfakes sendo registrados. A regulação avançou — foram 59 normas federais relacionadas à IA nos EUA em 2024, mais que o dobro de 2023 — mas os desafios éticos seguem à vista.

O AI Index também destaca que o raciocínio complexo continua sendo um desafio considerável para a IA. Mesmo com técnicas como "chain-of-thought" (CoT), os modelos ainda falham em resolver de forma confiável problemas que exigem raciocínio lógico estrito e onde soluções corretas podem ser provadas — como planejamento ou aritmética em instâncias maiores do que as vistas no treinamento.

Tal dificuldade limita a confiabilidade desses sistemas e sua adequação para aplicações de alto risco, onde precisão é fundamental, segundo o relatório. Benchmarks específicos como o PlanBench, focado em planejamento, evidenciam essa limitação: mesmo modelos de ponta ainda tropeçam em tarefas que exigem sequências mais longas de ações logicamente conectadas, contrastando com o sucesso em tarefas mais delimitadas.

Se 2023 foi o ano da popularização da IA, os dados de 2024 indicam sua consolidação como “infraestrutura” no mundo real. O cenário aponta para um 2025 de maior maturidade, com mais competição, regulação mais rigorosa e maior cobrança por responsabilidade. Os dados mostram que a tecnologia avançou, mas a adaptação humana a tal evolução continua desafiadora. Mais na íntegra do Artificial Intelligence Index Report 2025.

Google lança ambiente para criação de aplicações com IA

Google apresentou o Firebase Studio, ambiente de desenvolvimento em nuvem que integra assistentes Gemini, ferramentas de codificação e implantação numa só plataforma. A novidade permite criar aplicações completas usando linguagem natural ou desenhos, com suporte contínuo de IA em todo o ciclo de desenvolvimento, do protótipo à produção. Disponível em versão prévia com três workspaces gratuitos (30 para membros do Google Developer Program). Mais no anúncio oficial.

ChatGPT amplia recurso de memória entre conversas diferentes

ChatGPT recebeu atualização em 10/04/2025 que expande seu recurso de memória para funcionar entre conversas separadas. Diferente da versão anterior, que só mantinha contexto dentro da mesma conversa, agora o sistema pode lembrar preferências e informações compartilhadas em interações passadas. Usuários têm controle para gerenciar o que é lembrado, podendo revisar, excluir memórias específicas ou desativar completamente o recurso. Disponível para assinantes Plus e Pro, exceto em países europeus e alguns outros territórios. Mais na FAQ do ChatGPT.

Guia para testes modernos no Node.js ganha destaque no GitHub

O repositório "Node.js Testing Best Practices" é um guia abrangente para testes em aplicações Node.js. Recentemente atualizado, o projeto apresenta mais de 50 práticas recomendadas, organizadas em categorias como estratégia de testes, configuração de infraestrutura e bancos de dados, manipulação de mensagens em filas e mocking. O repositório inclui uma aplicação de exemplo completa com 40 testes executados em apenas 5 segundos, demonstrando como implementar testes de componentes que oferecem alto nível de confiança sem sacrificar a velocidade de desenvolvimento. Mais no repo do guia.

Shopify exige uso de IA como habilidade básica

Tobias Lütke, CEO da Shopify, compartilhou memorando interno determinando que o uso de IA é agora uma "expectativa básica" para todos os funcionários da empresa. O memorando estabelece que protótipos de projetos devem ser dominados pela exploração com IA, e perguntas sobre uso de inteligência artificial serão adicionadas às avaliações de desempenho. Lütke é enfático ao afirmar que não considera viável optar por não aprender essa habilidade: "Estagnação é uma falha em câmera lenta". Equipes precisarão demonstrar por que não conseguem atingir objetivos usando IA antes de solicitar mais recursos humanos. Mais no X de Lütke.

Lições de quatro anos tocando um SaaS em mercado competitivo

Max Rozen compartilha aprendizados práticos após quatro anos administrando o OnlineOrNot, ferramenta de monitoramento de sites, APIs, cron jobs etc. Entre os principais insights estão a importância da consistência (ao menos duas horas por dia de trabalho no projeto), foco em resolver problemas reais dos clientes em vez de apenas vender assinaturas, e estratégia de lançamentos pequenos e frequentes. Rozen também destaca como a documentação bem feita e a adaptação para dispositivos móveis impactam a retenção de usuários, e por que é contraproducente oferecer recursos "ilimitados". Mais no blog de Rozen.

Obrigado por acompanhar a BeTalent Academy. Se gostou, compartilhe e deixe um comentário. Até a próxima semana, com mais uma edição!

Deixe um comentário

BeTalent Academy