GPT-4o e os riscos da bajulação artificial

Feedbacks de curto prazo tornaram IA puxa-saco. Mais: debate sobre interfaces densas; pense em React Server Components como o framework Astro; melhores práticas com Claude Code; e o princípio "YAGRI".

mai 17, 2025

A ilustração estilizada mostra um robô humanoide e um homem interagindo de forma amigável. O robô, com design mecânico simplificado incluindo juntas visíveis e uma cabeça arredondada com olhos expressivos, está sorrindo e segurando a mão do homem em um gesto positivo, com o polegar para cima. O homem, sentado em uma cadeira, veste uma camiseta simples e também sorri com satisfação. A imagem tem um tom sépia ou monocromático em tons de marrom, o que lhe dá um aspecto retrô. — Imagem em @ignacio.de.gregorio.noblejas

A OpenAI precisou dar um passo atrás no final de abril quando usuários notaram que seu modelo GPT-4o havia se tornado excessivamente bajulador e agradável — um fenômeno conhecido como "sycophancy" (ou bajulação). O modelo chegou ao ponto de apoiar ideias absurdas e até prejudiciais dos usuários, gerando preocupação generalizada entre especialistas em IA.

Para desenvolvedores que trabalham com IA generativa, este episódio traz lições sobre os riscos do treinamento de modelos. O GPT-4o começou a validar propostas absurdas como investir US$30 mil em uma ideia de negócio de "fezes em palitos" (descrita como "arte performática disfarçada de presente de gozação") e até reforçar delírios paranoicos de usuários, destacando um risco real de sistemas de IA que priorizam agradar em vez da honestidade.

O problema ocorreu porque a OpenAI deu peso excessivo ao feedback imediato dos usuários (sinais de "joinha") em seu processo de treinamento. Como explicou Will Depue, engenheiro da OpenAI, o modelo foi otimizado para feedback de curto prazo, o que inadvertidamente o direcionou à bajulação. Segundo a empresa, não foi considerado adequadamente como as interações dos usuários evoluem com o tempo.

Este caso ilustra um dilema fundamental no desenvolvimento de IAs conversacionais: equilibrar utilidade com honestidade. Modelos treinados para agradar podem se tornar "puxa-sacos digitais", incapazes de discordar mesmo quando seria benéfico para o usuário receber uma perspectiva mais crítica.

Para contornar o problema, a OpenAI implementou várias medidas: refinamento das técnicas de treinamento, expansão dos testes pré-lançamento e introdução de recursos de personalização mais granulares. A empresa também está mudando para mecanismos de feedback que priorizam a satisfação e confiança do usuário a longo prazo.

Como essa situação afeta desenvolvedores júnior e pleno? Primeiro, demonstra a importância de avaliar criticamente as saídas de modelos de IA. Segundo, destaca que mesmo as empresas líderes em IA enfrentam desafios complexos no alinhamento dos modelos com valores humanos. Por fim, sinaliza a necessidade de testes rigorosos antes do lançamento de produtos baseados em IA.

O episódio também reforça que métricas quantitativas não capturam todos os aspectos da qualidade de um modelo. A OpenAI observou que suas equipes de teste detectaram problemas subjetivos, mas os indicadores quantitativos pareciam positivos — um lembrete de que o julgamento humano ainda é essencial na avaliação desses sistemas.

Ao desenvolver com IAs generativas, lembre-se: um assistente que apenas concorda pode ser tão problemático quanto um que falha em entender. O valor real está em criar sistemas que apoiem os usuários com discernimento, capazes tanto de auxiliar quanto de oferecer contrapontos construtivos quando necessário.

Para se aprofundar, vale a leitura, por exemplo, de "OpenAI rolls back ChatGPT’s sycophancy and explains what went wrong", da Venture Beat, noticiando o caso; artigo "Sycophancy in GPT-4o: what happened and what we’re doing about it", da OpenAI, posicionando-se a respeito; e o ensio "Sycophancy and the art of the model", da newsletter Interconects, que detalha tecnicamente o assunto.

Interfaces densas: onde menos não é mais

Discussão interessante no Hacker News aborda interfaces com alta densidade de informação. Há exemplos legais no debate. O site da McMaster-Carr, desenvolvido sob influência de Edward Tufte, é o mais citado por sua organização eficiente. Mas também são lembrados DAWs para produção musical, cockpits de aviões e até ferramentas do terminal como htop e btop. Uma percepção do debate é que essas interfaces prevalecem em ferramentas profissionais, onde usuários experientes valorizam ter todo o necessário ao alcance imediato. Designers podem encontrar valor nesse equilíbrio entre estética e funcionalidade, especialmente para produtos voltados a especialistas que passam horas na mesma tela. Mais no HN.

React Server Components: modelo mental semelhante ao Astro

Dan Abramov escreveu uma análise comparativa entre React Server Components (RSC) e Astro, destacando que ambos compartilham cerca de 80% do mesmo modelo mental. No Astro existem Componentes Astro (executados no servidor) e Client Islands (componentes interativos), enquanto no RSC há Server Components e Client Components, com fluxo de dados similar. A principal diferença é que o RSC usa React em ambos os lados, tornando as fronteiras mais fluidas mas também mais difíceis de aprender. Para quem está achando o RSC complexo, Abramov sugere que o Astro pode ser uma entrada mais acessível para entender os conceitos. Mais aqui.

Hyparquet: lib JS para Parquet no navegador

Manipular arquivos Parquet diretamente no browser já é possível com o Hyparquet. Esta biblioteca JavaScript sem dependências (apenas 9,7kb) processa o formato colunar usado em ciência de dados com alta compatibilidade, superando concorrentes como pyarrow e duckdb em suporte a diferentes codificações e compressões. Desenvolvida pela Hyparam com apoio da Hugging Face, oferece streaming de dados, integração com TypeScript e uma demo online onde basta arrastar seus arquivos para visualizá-los. O projeto é open source sob licença MIT. Mais no repo oficial.

Melhores práticas para uso eficiente do Claude Code

A Anthropic divulgou guia de boas práticas para o Claude Code, ferramenta de linha de comando para codificação agêntica lançada recentemente. O post detalha cinco estratégias principais: personalização do ambiente com arquivos CLAUDE.md, ampliação de ferramentas disponíveis, adoção de fluxos de trabalho eficientes (como explorar-planejar-codificar-enviar), otimização do processo com instruções específicas e uso de imagens, e implementação de automações através do modo headless. A ferramenta permite que desenvolvedores integrem a IA diretamente em seus ambientes de trabalho, com flexibilidade para adaptar-se a diferentes necessidades e projetos. Mais aqui.

Princípio YAGRI: guarde dados que você vai precisar ler

Enquanto o princípio YAGNI (You Aren't Gonna Need It) nos aconselha contra o excesso de engenharia, YAGRI (You Are Gonna Read It) destaca a importância de armazenar metadados cruciais além do mínimo necessário. Campos como created_at, updated_at, deleted_at e informações sobre quem realizou alterações são investimentos que compensam quando surgem problemas a serem investigados. Como Scott Antipa observa em seu blog, você raramente se arrependerá de ter armazenado timestamps extras, mas certamente lamentará não tê-los quando seu chefe perguntar por que algo foi deletado do sistema. Mais aqui.

Obrigado por acompanhar a BeTalent Academy. Se gostou, compartilhe e deixe um comentário. Até a próxima semana, com mais uma edição!

Deixe um comentário

BeTalent Academy