Anthropic publica tools para rastrear circuitos neurais em LLMs

Lib open-source permite visualizar "pensamento" de LLM em grafos. Mais: DigitalOcean permite deploy por linguagem natural, IA impacta vagas de recém-formados e as práticas da AWS contra bugs.

jun 07, 2025

Captura de tela da interface Neuronpedia (ferramenta para visualizar circuitos neurais de IA) exibindo grafo neural com nós conectados representando o processamento da pergunta "capital do estado que contém Dallas", mostrando conexões entre conceitos como Dallas, Texas, estado e capital até chegar à resposta Austin. — Interface do Neuronpedia mostra como modelo "raciocina" graficamente: de Dallas para Texas, depois para Austin.

A Anthropic tornou público o circuit-tracer, biblioteca open-source que permite mapear como modelos de linguagem processam informações internamente. Imagine poder "abrir o capô" de um LLM e ver quais componentes se ativam quando ele responde uma pergunta. A ferramenta, hospedada no GitHub sob licença MIT, oferece essa visibilidade através de grafos visuais que mostram o fluxo de processamento, com interface web integrada ao Neuronpedia.

O problema que a ferramenta resolve é fundamental: modelos de linguagem são "caixas-pretas" que produzem respostas sem explicar seu raciocínio interno. Para pesquisadores e desenvolvedores interessados em compreender IA, isso significa impossibilidade de estudar como modelos tomam decisões, identificar quais mecanismos são responsáveis por comportamentos específicos, ou validar hipóteses sobre o funcionamento interno dos sistemas.

O circuit-tracer funciona através de três etapas principais:

identifica "circuitos computacionais" — sequências de operações que o modelo executa para chegar a uma resposta específica;
visualiza esses circuitos como grafos interativos onde cada nó representa um conceito ou operação; e
permite experimentos controlados para testar hipóteses sobre o funcionamento.

A biblioteca suporta, inicialmente, os modelos Gemma-2-2b e Llama-3.2-1b, com planos de expansão para outras arquiteturas.

Para usar a ferramenta, desenvolvedores podem acessar diretamente a interface do Neuronpedia, que funciona como um navegador web para circuitos neurais, ou executar o circuit-tracer localmente via linha de comando. O comando básico requer o texto a ser analisado, o conjunto de transcoders e um identificador. A ferramenta então gera grafos JSON que mostram, por exemplo, como o modelo processa a pergunta "Qual a capital do Texas?" — revelando quais conceitos (Texas, estados, capitais) se ativam e como se conectam até produzir "Austin".

Os grafos de atribuição resultantes contêm quatro tipos de elementos:

tokens de saída candidatos (possíveis respostas);
features ativas dos transcoders (conceitos reconhecidos);
embeddings dos tokens de entrada (palavras da pergunta); e
nós de erro representando computações não capturadas pelo transcoder.

As conexões entre esses elementos mostram efeitos diretos e lineares de como a informação flui desde a pergunta até a resposta final.

A metodologia por trás do circuit-tracer foi apresentada em março pela Anthropic em trabalho técnico detalhado. O desafio central era que neurônios individuais em modelos de linguagem sofrem de "polissemantia" — respondem a múltiplos conceitos não relacionados simultaneamente. Isso torna impossível entender o que cada parte do modelo realmente faz.

A solução usa "transcoders cross-layer" — componentes que substituem blocos MLP tradicionais por features mais específicas e interpretáveis. É como refatorar código legado: em vez de uma função gigante que faz várias coisas, você cria funções menores e especializadas. Esses transcoders capturam computações que se estendem por múltiplas camadas do modelo, colapsando operações repetitivas em features únicas.

O método também "congela" padrões de atenção e denominadores de normalização do modelo original, tornando as interações entre features lineares e previsíveis. Isso permite rastrear causa e efeito de forma direta. O modelo de substituição resultante reproduz o comportamento do modelo original em aproximadamente 50% dos casos testados, oferecendo transparência significativa sobre os mecanismos computacionais.

Os pesquisadores validaram as descobertas através de experimentos de intervenção: modificaram ativações de features específicas e observaram como isso afetava as respostas e outras features downstream. Estudos de caso incluíram completação de acrônimos fictícios, recall factual sobre figuras conhecidas como Michael Jordan, e operações aritméticas simples, revelando circuitos especializados para cada tipo de tarefa.

O trabalho complementar "On the Biology of a Large Language Model" aplicou essas técnicas ao Claude 3.5 Haiku em nove estudos comportamentais. As investigações revelaram mecanismos como raciocínio multi-etapas (Dallas → Texas → Austin), planejamento antecipado na escrita de poemas, circuitos multilíngues que misturam processamento específico por idioma com representações abstratas e sistemas de reconhecimento de entidades que determinam quando o modelo deve admitir ignorância versus quando pode alucinar.

Para quem pesquisa ou usa IA, essas ferramentas abrem possibilidades de investigar mecanismos de raciocínio, identificar circuitos responsáveis por comportamentos específicos e validar teorias sobre funcionamento interno de modelos de linguagem. A disponibilização responde ao que o CEO da Anthropic, Dario Amodei, destacou sobre a urgência da pesquisa em interpretabilidade — compreender mecanismos internos da IA torna-se necessário à medida que as capacidades dos modelos avançam rapidamente.

O projeto foi desenvolvido pelos Anthropic Fellows Michael Hanna e Mateusz Piotrowski, com mentoria de Emmanuel Ameisen e Jack Lindsey. A integração ao Neuronpedia foi implementada pela Decode Research. No YouTube, há uma entrevista com Ameisen sobre o projeto. Algo importante, "de fronteira", mas também divertido de conhecer e experimentar como funciona.

DigitalOcean lança servidor MCP para deploy por linguagem natural

A DigitalOcean disponibilizou servidor MCP (Model Context Protocol) que permite gerenciar deployments no App Platform usando comandos em linguagem natural dentro de editores como Cursor e Claude Desktop. O sistema elimina necessidade de usar APIs, YAML ou dashboards manuais. Desenvolvedores podem fazer deploy, restart de serviços, consultar logs e criar aplicações apenas digitando comandos como "deploy minha app Flask no DigitalOcean". A ferramenta open source requer token de API da plataforma. Mais no anúncio oficial.

Quarkdown adiciona funções e loops ao Markdown

Quarkdown — "markdown com superpoderes" — estende Markdown com funções, variáveis e loops, transformando-o em uma "linguagem de programação" para documentos. A ferramenta compila texto dinâmico para HTML e PDF, permitindo criar livros, artigos e apresentações interativas. Oferece preview ao vivo, compilação rápida e biblioteca padrão com ferramentas de layout e matemática. O projeto open source no GitHub soma 4,9k estrelas e mantém desenvolvimento ativo. Mais no repo.

Pesquisadores da AWS documentam práticas robustas contra bugs

Marc Brooker e Ankush Desai, da AWS, publicaram artigo detalhando como a empresa previne bugs em sistemas complexos. As estratégias envolvem linguagens especiais (TLA+ e P) para modelar sistemas antes de programar, testes que geram cenários aleatórios e simulações de falhas. O Fault Injection Service (que simula falhas controladas) testa como aplicações respondem a problemas, por exemplo. Equipes do S3, DynamoDB, Aurora e EC2 aplicam os métodos há 15 anos. Resultado: menos bugs, desenvolvimento mais rápido e melhor performance. Mais no artigo completo.

IA já afeta vagas de recém-formados no mercado de trabalho

Desemprego entre graduados chegou a 5,8%, com maior impacto em áreas técnicas. Empresas de tecnologia suspendem contratações abaixo do nível L5 e uma startup reduziu equipe de dados de 75 para uma pessoa usando IA. CEO da Anthropic projeta eliminação de metade das vagas de entrada em cinco anos. Executivos adotam filosofia "IA-first": testam automação antes de contratar humanos. O fenômeno força jovens desenvolvedores a repensar estratégias de carreira. Mais na coluna Hard Fork, do New York Times.

Desenvolvimento de software não é manufatura

Patricia Aas argumenta que metodologias como Lean Software Development partem de uma premissa equivocada: tratar programação como manufatura. Para ela, desenvolvedores não "produzem" código, mas projetam soluções através de descoberta e iteração. O texto explica por que GUIs são refeitas múltiplas vezes: usuários sabem o que não querem quando veem, mas raramente conseguem descrever suas necessidades com precisão. A autora defende que o foco deve estar em entender profundamente o problema, não em "eliminar desperdício" ou acelerar produção. Mais no blog da programadora.

Obrigado por acompanhar a BeTalent Academy. Se gostou, compartilhe e deixe um comentário. Até a próxima semana, com mais uma edição!

Deixe um comentário

BeTalent Academy