A Wired disse que o Papa Leão XIV usa IA pra escrever contra a IA. Testamos o detector com um artigo humano e saiu 86%
Antes de rir da manchete, olha pro detector. A gente testou.
A Wired publicou nesta quarta que uma ferramenta de detecção de inteligência artificial chamada Pangram classificou alguns dos avisos públicos do Papa Leão XIV contra os riscos da IA como texto “provavelmente gerado por IA”.
A manchete é redonda. O argumento é curto. A piada é perfeita: o homem mais famoso do planeta alertando sobre máquinas que escrevem sozinhas estaria, segundo um software, deixando uma máquina escrever os próprios alertas por ele.
Antes de rir ou compartilhar, vale olhar pra quem tá fazendo a acusação. Porque detector de IA, como categoria de produto, é uma das coisas mais mal resolvidas do mercado de tecnologia.
O contexto do Papa Leão XIV
O Papa Leão XIV, nome escolhido pelo cardeal Robert Francis Prevost depois da eleição em 8 de maio de 2025, tem feito do tema da inteligência artificial uma das bandeiras centrais do pontificado dele. A escolha do nome “Leão” foi justificada por ele mesmo como referência direta ao Papa Leão XIII, que respondeu à primeira revolução industrial com a encíclica Rerum Novarum, publicada em 15 de maio de 1891. O paralelo contemporâneo, segundo a Sala de Imprensa da Santa Sé, é responder à Quarta Revolução Industrial da IA com defesa da dignidade humana, da justiça e do trabalho.
Ou seja: o tema IA não é acessório pro papado do Leão XIV. É central. Os avisos que a Pangram analisou são parte de uma linha editorial pública que o Vaticano organiza desde 2025.
Como funciona o Pangram e por que isso importa
A Pangram é uma extensão de Chrome e serviço web que analisa texto e devolve um percentual de probabilidade de o conteúdo ter sido gerado por IA. Compete com ferramentas como GPTZero, Originality.AI e ZeroGPT. Todas essas ferramentas usam a mesma abordagem geral: treinar um modelo de machine learning pra distinguir padrões estatísticos típicos de texto humano versus texto de LLM.
O problema técnico é conhecido: detectores de IA têm taxa de erro alta e são especialmente ruins com dois tipos de texto. Primeiro, texto escrito por não-nativos em inglês. O estudo mais citado sobre o assunto é de um grupo de Stanford publicado em 2023: ao analisar 91 redações de não-nativos em inglês escritas para o exame TOEFL, os detectores testados classificaram incorretamente 61,22% como geradas por IA. Por outro lado, os mesmos detectores acertaram quase 100% das redações escritas por estudantes americanos do oitavo ano. A diferença de performance entre grupos é o dado essencial.
Segundo, texto editado, formal, em prosa padronizada. Exatamente o tipo de texto que sai de qualquer secretaria institucional, incluindo a do Vaticano. A OpenAI aposentou o próprio detector de IA em julho de 2023 justamente por “baixa taxa de acurácia”. O Ars Technica chegou a demonstrar que um detector popular classificou o texto da Constituição dos Estados Unidos como gerado por IA.
Um teste rápido: texto humano em português classificado como 86% IA
Um teste que a gente acabou de fazer aqui na redação, pra sentir o tamanho do problema. Colei num desses detectores populares o primeiro parágrafo do artigo que publicamos em 11 de abril sobre o coquetel molotov jogado na casa do Sam Altman. O texto foi escrito por um editor humano do Ovelha Elétrica, com dedos biológicos e um cérebro falho, sem assistência de LLM, sem rascunho gerado, sem cola de ChatGPT. Jornalismo direto, frases curtas, nomes próprios, citações.
O detector devolveu: 86% de conteúdo de IA. Junto com um aviso em bom português: “A maioria das instituições acadêmicas e sites não considerará seu texto como único e pronto para publicação”.
Texto humano, em português brasileiro, classificado como majoritariamente artificial por uma ferramenta vendida exatamente com a promessa de separar um do outro. A razão provável é a mesma do estudo de Stanford: texto formal, com estrutura institucional-jornalística, escrito por não-nativo em inglês (o detector foi treinado em inglês) e traduzido por padrão pra inglês antes da análise carrega marcas estatísticas que o modelo confunde com saída de LLM.
Isso é o tamanho do erro que esses produtos carregam agora. E é o exato tipo de erro que provavelmente explica a manchete da Wired sobre o Papa.
O que a Pangram provavelmente está detectando
Três hipóteses são possíveis para o resultado da Pangram sobre os textos papais, e vale colocar em ordem de probabilidade.
A primeira e mais provável: a secretaria do Vaticano usa, como qualquer organização moderna, ferramentas de tradução automática e assistência de redação. Isso não é “IA escreveu o texto”. É ferramenta de processamento incorporada ao fluxo de trabalho. Um rascunho em italiano passa por sistema de tradução pra inglês, alguém revisa, alguém edita, publica. O texto final carrega marcas estatísticas que um detector pode classificar como “IA” mesmo tendo sido redigido por humanos.
A segunda, menos provável mas possível: alguém na comunicação vaticana está efetivamente usando ChatGPT ou equivalente pra rascunhar textos. Isso seria constrangedor, mas não surpreendente em 2026. Comunicação institucional de qualquer governo, igreja ou empresa usa IA de alguma forma nesse momento. A pergunta é se foi usada como rascunho ou como cola.
A terceira, também plausível: o detector simplesmente errou. Pangram não é infalível. A empresa divulga acurácia alta em materiais de marketing, mas não permite auditoria independente completa do modelo. Em textos formais, institucionais e traduzidos, a taxa de falso positivo sobe.
O que a manchete da Wired está fazendo
A reportagem tem valor jornalístico. É legítimo perguntar se uma instituição que emite alertas sobre IA está, ela mesma, usando IA. Mas a manchete transforma um resultado estatístico incerto em confissão. A frase “foram gerados por IA” sugere certeza. “Um detector classificou como provável” é outra coisa.
Se a gente comprar a manchete sem olhar o detector, a gente comete o mesmo tipo de erro que os detectores cometem: confunde padrão com verdade. Isso virou, na última década, o maior problema da internet. Ferramenta barata devolve resultado convincente, usuário aceita sem questionar, virálico vira consenso.
No fim, não importa muito se o Vaticano usa ferramenta de tradução ou se a Pangram errou. Importa que a discussão sobre IA no ambiente público depende de ferramentas que a própria IA fornece, e essas ferramentas são menos confiáveis do que as manchetes dão a entender. A gente já viu isso antes em outros contextos, e a lógica é sempre a mesma: o sistema que te oferece a solução é o mesmo que te oferece o diagnóstico. Quem paga o custo da dúvida é o leitor.
Lucas Ferreira
Gamer desde o PS1, cético desde sempre
Jornalista de tecnologia e games. Cobre a indústria tech e gaming há mais de 10 anos.
LEIA TAMBEM
A Flórida virou o primeiro estado a processar a OpenAI - e quer Sam Altman pagando do próprio bolso
A IA vai fazer 80% das suas tarefas. Os 20% que sobram decidem seu emprego