Gigantes de tech descobriram que tokens de IA custam mais que funcionários. E foram elas que criaram o problema

A Uber consumiu o orçamento inteiro de ferramentas de IA de 2026 em quatro meses. A Microsoft incentivou ativamente o uso do Claude Code entre seus engenheiros, viu o custo escalar fora do planejado, e cancelou a maioria das licenças seis meses depois. Um vice-presidente da Nvidia admitiu publicamente que o custo de computação da sua equipe já supera o gasto com os próprios funcionários.

O script era simples: adota IA, corta custo de pessoal, empresa economiza dinheiro. O problema é que token tem preço. Quando 84% dos seus engenheiros passam a usar a ferramenta e o volume triplica, a matemática quebra.

A Uber zerou o caixa de IA em quatro meses fazendo exatamente o que foi incentivada a fazer

Entre janeiro e abril de 2026, o Uber não só adotou ferramentas de IA para programação como foi além de qualquer projeção financeira. O Claude Code, assistente de código da Anthropic que opera direto no terminal do desenvolvedor, passou de 32% para 84% dos 5.000 engenheiros da empresa em três meses. Os custos de IA cresceram 6 vezes desde 2024.

O detalhe que torna o caso cirúrgico: a Uber criou um ranking interno classificando equipes pela quantidade de IA usada. Incentivou adoção, mediu por volume de uso, e depois ficou surpresa quando o volume explodiu.

O custo individual chegou a entre US$ 500 e US$ 2.000 por engenheiro por mês. Com cinco mil engenheiros, faz a conta. Não deu para esperar dezembro.

O COO da empresa começou a questionar publicamente se o gasto estava valendo. A análise interna revelou que o aumento no consumo de tokens não resultou num aumento proporcional de valor entregue aos usuários do aplicativo.

Tokenmaxxing: quando a empresa cria o próprio problema e vai reclamar depois

O que aconteceu na Uber tem nome: tokenmaxxing. É o fenômeno em que funcionários usam IA para absolutamente tudo, seja para marcar pontos em rankings internos, seja porque a empresa empurrou isso como métrica de produtividade.

Alguns usuários chegaram a contas mensais individuais de mais de US$ 150.000 em tokens. Um desenvolvedor independente, criador de uma ferramenta chamada OpenClaw, gastou US$ 1,3 milhão num único mês.

Bryan Catanzaro, vice-presidente de aprendizado profundo aplicado da Nvidia, disse sem rodeios: “Para a minha equipe, o custo de computação já está muito além do custo dos funcionários.” É o VP de uma empresa que fabrica exatamente os chips que alimentam essa computação. Se até ele acha caro, presta atenção.

Um agente de IA pode consumir até mil vezes mais tokens do que uma pergunta simples

Parte do problema é estrutural e tem a ver com o que as empresas estão tentando fazer com IA agora.

Quando você faz uma pergunta a um modelo de linguagem, ele usa um volume de tokens para responder. Quando você usa um agente de IA, que é um sistema que divide uma tarefa em etapas, executa cada uma, verifica o resultado e decide o próximo passo automaticamente, o consumo de tokens pode ser mil vezes maior para chegar ao mesmo resultado final.

Isso importa porque a corrida atual das grandes empresas de tecnologia é exatamente para agentes. São eles que prometem automatizar fluxos de trabalho inteiros, não só responder perguntas. E são eles que multiplicam a conta de forma proporcional à complexidade da tarefa.

O Goldman Sachs projetou que o consumo global de tokens pode crescer 24 vezes até 2030, chegando a 120 quadrilhões de tokens por mês. Cada token mais barato, mas muito mais tokens sendo consumidos.

A Microsoft distribuiu as licenças, incentivou o uso, e cancelou seis meses depois

A Microsoft seguiu trajetória parecida. A empresa havia empurrado ativamente o Claude Code para seus engenheiros internos, posicionando a ferramenta como parte do stack de desenvolvimento. A adoção foi alta demais, o custo foi além do planejado, e as licenças foram canceladas.

Agora a empresa está direcionando o uso para o Copilot CLI, a ferramenta própria da Microsoft, onde tem controle maior sobre o custo por consulta.

O padrão se repete: empresa incentiva, ferramenta funciona, conta explode, empresa recua.

Tokens ficando mais baratos não significa conta menor

O paradoxo central da situação: o preço unitário dos tokens está caindo. A Gartner projeta que o custo de inferência em modelos sofisticados vai cair 90% até 2030 em comparação com 2025. Parece bom.

O problema é o volume. Quando tokens ficam mais baratos, as empresas usam mais. Quando usam mais, o total sobe. É o Paradoxo de Jevons aplicado à IA: quanto mais eficiente fica a tecnologia, maior o consumo total de recursos. Aconteceu com os motores a vapor na industrialização. Aconteceu com aviões mais econômicos, que resultaram em mais voos, não menos combustível. Agora está acontecendo com IA.

O analista Will Sommer, do Gartner, resumiu o ponto: “Os diretores de produto não deveriam confundir a queda no preço dos tokens com a democratização do raciocínio de fronteira.” Raciocínio de fronteira é o processamento pesado que os modelos mais avançados fazem. Fica mais barato por token, mas não deixa de ser caro quando você usa em escala.

A promessa original da IA nas empresas era que ela ia multiplicar a produtividade dos funcionários sem multiplicar o custo. O que está acontecendo é que ela está criando uma nova linha de despesa significativa, e essa linha ainda não tem teto definido. A Uber e a Microsoft descobriram isso antes da maioria. Outras empresas estão descobrindo agora.

Gigantes de tech descobriram que tokens de IA custam mais que funcionários. E foram elas que criaram o problema

A Uber zerou o caixa de IA em quatro meses fazendo exatamente o que foi incentivada a fazer

Tokenmaxxing: quando a empresa cria o próprio problema e vai reclamar depois

Um agente de IA pode consumir até mil vezes mais tokens do que uma pergunta simples

A Microsoft distribuiu as licenças, incentivou o uso, e cancelou seis meses depois

Tokens ficando mais baratos não significa conta menor

Lucas Ferreira

LEIA TAMBEM

O especialista que usa a física para desmascarar imagem feita por IA

É uma péssima, péssima ideia usar sua arroba do Instagram no seu WhatsApp

Uma mentira sobre uma camisa verde foi suficiente para fazer chatbots avançados revelar receita de cocaína

A Uber zerou o caixa de IA em quatro meses fazendo exatamente o que foi incentivada a fazer

Tokenmaxxing: quando a empresa cria o próprio problema e vai reclamar depois

Um agente de IA pode consumir até mil vezes mais tokens do que uma pergunta simples

A Microsoft distribuiu as licenças, incentivou o uso, e cancelou seis meses depois

Tokens ficando mais baratos não significa conta menor

Lucas Ferreira

LEIA TAMBEM

O especialista que usa a física para desmascarar imagem feita por IA

É uma péssima, péssima ideia usar sua arroba do Instagram no seu WhatsApp

Uma mentira sobre uma camisa verde foi suficiente para fazer chatbots avançados revelar receita de cocaína

FICA POR DENTRO

FICA POR
DENTRO