🃏 GPT-4o e os prenúncios de uma nova User Experience (UX)
OpenAI lança recursos que aproximam IA da facilidade de um WhatsApp, e Google (de novo) corre atrás. Mais: WebAssembly para Flutter e Dart, Python 3.13 e buscando engenheiros 10x+

Temos tentado fugir do hype da IA, mas há momentos em que é prudente não fechar os olhos ao que vem da área.
Nesta semana, a OpenAI, proprietária do ChatGPT, anunciou o GPT-4o, um LLM multimodal capaz de lidar com texto, visão e áudio. O "o" vem de "omni" ( "tudo" ou "todo", em grego), pelo fato da versão ser mais completa que as anteriores.
Entusiastas ficaram eufóricos e houve uma enxurrada de notícias que beiram propagandas à OpenAI, é claro. O interessante, porém, é o potencial de democratização da IA que o GPT-4o inaugura, o que pode ser o prenúncio de uma mudança radical na User Experience (UX) como a conhecemos.
A capacidade de visão permite, por exemplo, apontar o smartphone à realidade e pedir que o GPT-4o explique o que está vendo. Isso o torna uma ferramenta de acessibilidade: guiar uma pessoa cega na rua ou descrever algo a ela, por exemplo.
Também permitirá apontar a câmera a uma equação matemática, uma planilha do Excel, um artefato de design ou um código e pedir que a IA os explique.
O modelo conseguirá, inclusive, observar o comportamento de uma pessoa e falar sobre — o que pode ser uma maneira de você treinar para entrevistas de emprego ou até para encontros (rs). Ou permitirá que, apontando um smartphone a outro, duas IAs conversem entre si.
A nova versão também lidará com inputs e outputs por voz diretamente no prompt, em mais de 50 idiomas. Ou seja, será um tradutor em tempo real.
É mais ou menos como a democratização que o WhatsApp trouxe à comunicação. E, repetindo, pode ser o início de uma mudança de paradigma em UX. Em vez de foco no visual, com layouts, botões e formulários, GPT4-o abre caminho para algo fluido e natural, baseado em voz, visão e troca de ideias com a IA, como um assistente pessoal de fato.
Mais a respeito neste artigo, na transmissão oficial do anúncio e nesta playlist de vídeos da OpenAI (melhor parte) demonstrando capacidades do GPT-4o.
Google na mesma linha, mas atrás — e com IA na busca
O anúncio da OpenAI ocorreu um dia antes do Google I/O 2024, deixando o Google novamente atrás quando o assunto é IA. Com muitas promessas "para breve", de relevante a big tech anunciou o Projeto Astra, também uma IA multimodal — em resposta ao GPT-4o — e Veo, gerador de vídeos de 1080p a partir de texto.
Fora outras novidades menores, como Gemini Nano (LLM pequeno que será integrado ao Chrome), as atenções se voltaram para a integração da IA na busca.
Gradativamente, a lista de links desaparecerá para dar lugar a respostas geradas por IA — o que, como comentado na edição anterior, tem o poder de afetar negócios de websites e conteúdos baseados em SEO, ou seja, a web como um todo.
Nem o próprio Google, nem a OpenAI, muito menos "gurus" sabem onde isso vai dar. Muitas dessas novidades podem ser ultrapassadas ou esquecidas rapidamente, mas há aí "faíscas" de possíveis "incêndios", que podem mudar muito do que fazemos como usuários — e, consequentemente, como designers e desenvolvedores.
⚙️ WebAssembly ganha suporte estável em Flutter e Dart
Flutter e a linguagem Dart, que o acompanha, ganharam suporte estável para WebAssembly (Wasm). O anúncio foi feito na Google I/O, esta semana. WebAssembly é um código binário (baixo nível) que permite executar aplicações de alto desempenho em browsers e outros ambientes. Segundo o Google, Wasm traz um desempenho aprimorado para renderização e outros aspectos, comparáveis a aplicativos nativos móveis e desktop. O anúncio trouxe outras novidades, como novos recursos para desenvolvimento de jogos e otimizações para iOS. Mais neste artigo e nas docs do Flutter 3.22 e Dart. 3.4.
🐍 Python 3.13 vem com novo REPL, JIT experimental e menos "gordura"
Também tem novidades em Python. A versão 3.13 traz um novo REPL (intérprete interativo) e, em modo experimental, um compilador JIT (Just-in-time) e suporte sem GIL (Global Interpreter Lock) em CPython, para permitir threads paralelas. Além disso, foi feita uma faxina na linguagem. Módulos da biblioteca padrão, marcados como obsoletos deste a versão 3.11, começaram a ser definitivamente eliminados. Completam as novidades mensagens de erros aprimoradas, melhorias de tipos e outros ajustes. Mais na doc do Python.
💪 Uma lista de requisitos para engenheiros 10x+
PostHog, plataforma analítica para produtos de software, lista em sua newsletter — muito boa, por sinal — qualidades que busca em engenheiros. Os requisitos são bastante atuais e se encaixam em diversas empresas, incluindo a Be. O foco está em pessoas com mentalidade de prototipação e experimentação, que tenham paixão genuína por construir, sejam “obcecadas pelo cliente”, compreendem o contexto amplo do negócio, estejam confortáveis com a escrita (por causa do trabalho remoto assíncrono) e agradáveis no dia a dia. Isso permite equipes pequenas e autônomas, hierarquia mínima, agilidade e crescimento rápido com poucas e boas contratações. Mais aqui.
💬 Copilot Workspace e o inglês como nova linguagem de programação
Na edição de 3 de maio, falamos do GitHub Copilot Workspace, assistente de IA para projetos de ponta-a-ponta. Neste artigo — com o título sugestivo de "A próxima grande linguagem de programação é o inglês" —, há uma análise interessante e mais pragmática da ferramenta. Embora entender JavaScript, Python ou mesmo C continuarão sendo necessários, o autor opina que a rotina de desenvolvimento será cada vez mais baseada em inputs escritos em linguagem natural (por isso, o inglês) em interfaces como a do Workspace.
🗜️ Sete recursos JavaScript para iniciantes e experientes
Na edição anterior, trouxemos uma lista de recursos JS para iniciantes aprenderem antes de React.js. Agora, sete itens que valem até para devs experientes: array
, for loop
, forEach
, map
, reduce
, substring
e switch
. Bom, você deve saber: arrays
armazenam coleções de valores; for loop
é o loop clássico, enquanto forEach
é um loop funcional mais moderno; map
é a função que aplica uma operação em cada elemento de um array; reduce
transforma uma coleção em um único valor; substring
extrai parte de uma string e switch
é a estrutura de controle de fluxo que trata múltiplas condições. Mais na InfoWorld.
❓O que são "design patterns" em software?
Muitos devem conhecer ou intuir. Não tem nada a ver com design no sentido de visual e estética, é claro. Vale pesquisar. Responderemos na próxima edição.
A propósito, a resposta à pergunta da edição anterior é: Programação Orientada a Objetos (OOP) e a Programação Funcional (FP) são paradigmas de programação. Grosso modo, OOP se baseia na criação de objetos que contêm dados (atributos) e comportamentos (métodos), normalmente a partir de classes, que permitem encapsulamento, herança e polimorfismo. Já FP enfatiza avaliação de funções puras, sem efeitos colaterais, em que dados são imutáveis e funções operam sobre tais dados (entradas) para produzir novos dados (saídas). Apesar de haver fanáticos por um ou outro, ambos se prestam às mesmas finalidades e têm vantagens e desvantagens. Este artigo dá uma boa introdução. Smalltalk é um exemplo de linguagem puramente OO. Haskell é o maior exemplo em FP.
Obrigado por ler!
Voltaremos com mais fatos, tendências e dicas na próxima semana. Curta, compartilhe, comente e vote na enquete. Obrigado por ler e por estar com Be!