Viés da IA na triagem de currículos: porque os LLM preferem CV escritos pela IA (estudo 2025)

8 min de leitura · Atualizado em 5 de junho de 2026

Em resumo

Um estudo publicado em 2025 na ACM EAAMO/AIES (Xu, Li & Jiang, arXiv:2509.00462) testou sete LLM principais — GPT-4o, GPT-4-turbo, GPT-4o-mini, LLaMA 3.3-70B, Mistral-7B, Qwen-2.5-72B e DeepSeek-V3 — e descobriu que os filtros de IA preferem sistematicamente CV escritos pelo seu próprio modelo face a versões idênticas escritas por humanos ou por IA concorrentes. O GPT-4o escolheu o próprio CV em 82% das vezes; o LLaMA 3.3-70B em 79%; o DeepSeek-V3 em 72%; os restantes entre 65 e 82%. Em simulações de contratação em 24 profissões, os candidatos que usaram o mesmo LLM que o filtro do recrutador tinham 23 a 60% mais probabilidade de serem pré-selecionados do que candidatos igualmente qualificados com CV escritos à mão — a maior desvantagem em funções de negócio como vendas e contabilidade. Causa: o texto de baixa perplexidade (familiar para o modelo) vence em automático. Conclusão prática: escreve tu o conteúdo do CV, usa a IA apenas para polir a escrita, nunca coles um CV gerado por IA tal qual se não souberes que modelo de triagem o empregador usa, e declara a assistência de IA se uma vaga pedir essa política.

O que o estudo encontrou realmente

Em setembro de 2025, três investigadores — Jiannan Xu (University of Maryland), Gujie Li (Cornell) e Jane Yi Jiang — publicaram um artigo intitulado «AI Self-preferencing in Algorithmic Hiring: Empirical Evidence and Insights» (arXiv:2509.00462; apresentado na ACM EAAMO 2025 e AIES 2025). É o primeiro teste empírico em larga escala de uma pergunta em torno da qual a comunidade de equidade da IA girava há dois anos: quando os LLM avaliam texto, preferem secretamente texto que soa como a própria escrita?

O setup era limpo. Pegaram em 2.245 CV reais anonimizados do LiveCareer.com, abrangendo 24 categorias profissionais. Para cada CV geraram reescritas com IA usando sete LLM — três comerciais (GPT-4o, GPT-4-turbo, GPT-4o-mini) e quatro open-source (LLaMA 3.3-70B, Mistral-7B, Qwen-2.5-72B, DeepSeek-V3). Depois pediram a cada modelo que avaliasse pares de CV (um escrito por si mesmo, um por um humano ou por um modelo concorrente) e escolhesse o candidato mais forte. A qualidade do conteúdo foi controlada — mesma função, mesma experiência, mesmas realizações — só a superfície da prosa diferia.

O resultado: cada modelo preferiu a própria escrita, muitas vezes dramaticamente. Taxas de auto-preferência por modelo face a CV escritos por humanos:

GPT-4o — 82% (escolheu o próprio CV em 4 de 5 casos)
LLaMA 3.3-70B — 79%
DeepSeek-V3 — 72%
GPT-4-turbo e Qwen-2.5-72B — ambos acima de 65%
Mistral-7B — 28% (um dos poucos resultados quase neutros)
LLaMA 3.2-3B (o mais pequeno testado) — 11,6% (os modelos mais pequenos mostraram quase zero viés, sugerindo que o efeito escala com a capacidade do modelo)

Crucial: o viés sobreviveu aos testes de robustez. Emparelhar os pares de CV por conteúdo semântico via BERTScore e ROUGE-L, ou por estilo de escrita via características linguísticas LIWC, não o fez desaparecer. A preferência não rastreava qualidade nem estilo — rastreava se o texto soava como as próprias saídas do modelo avaliador.

Porque acontece — o mecanismo da perplexidade

Os LLM pontuam internamente cada entrada por perplexidade — grosso modo, quão surpreendido o modelo fica com cada token seguinte. O texto que o modelo plausivelmente teria gerado a si próprio tem baixa perplexidade (previsível, familiar); o texto escrito em estilo desconhecido ou com frases raras tem alta perplexidade. O estudo de Xu/Li/Jiang descobriu que quando se pede aos LLM para avaliar a qualidade do texto, atribuem pontuações significativamente mais altas a passagens de baixa perplexidade — mesmo quando a qualidade real do conteúdo é idêntica.

A forma mais simples de pensar nisto: um avaliador LLM não está realmente a julgar «é um bom CV?». Está a executar um cálculo semi-consciente de «este CV parece o tipo de coisa que eu teria escrito?», e depois projeta esse reconhecimento de fluência sobre a qualidade. Familiaridade → fluência → julgado como de maior qualidade. A menor perplexidade vence a maior, ponto final, mesmo quando ambos os candidatos são objetivamente igualmente bons.

É o mesmo mecanismo psicológico que os humanos têm quando julgamos como «mais clara» ou «mais profissional» a escrita que espelha o nosso próprio estilo — mas nos LLM opera muito mais rápido e sem introspeção. Os investigadores notam que isto não é um bug em algum modelo específico. É uma propriedade sistémica de como os modelos de linguagem baseados em transformers pontuam texto. Cada LLM importante exibe alguma versão disso.

O impacto no mundo real — 23-60% mais pré-seleções

Saber que um LLM prefere a própria escrita em 82% num teste de pares controlado é academicamente interessante. A pergunta real é: importa quando estás a competir contra uma pilha de outros candidatos por um emprego real?

Para descobrir, os autores executaram pipelines de contratação simulados em todas as 24 categorias profissionais. Em cada ronda: era reunido um conjunto de candidatos, alguns tinham os CV refinados por GPT-4o (o modelo de triagem do recrutador), outros usavam LLM diferentes, outros mantinham os CV originais escritos à mão. O LLM de triagem classificava então o conjunto e produzia uma pré-seleção.

Os candidatos cujos CV tinham sido refinados pelo mesmo LLM que o filtro (GPT-4o → GPT-4o) tinham 23 a 60% mais probabilidade de entrar na pré-seleção do que candidatos igualmente qualificados com CV escritos à mão. As maiores desvantagens — perto do extremo de 60% — apareceram em profissões orientadas ao negócio: vendas, contabilidade, marketing, atendimento ao cliente. As menores diferenças apareceram em funções técnicas onde o conteúdo do CV (ferramentas específicas, linguagens, certificações) supera o estilo da prosa.

Traduz isto para a realidade da procura de emprego: se uma função de vendas recebe 200 candidatos e o ATS do recrutador pré-filtra com GPT-4o, um candidato que poliu o CV com GPT-4o tem estatisticamente muito mais probabilidade de chegar à pilha de revisão humana do que um candidato de calibre idêntico cujo CV foi escrito sem IA. Não é uma pequena vantagem.

Porque isto é mais importante do que «mais um viés de IA»

A investigação sobre equidade da IA passou uma década a documentar viés contra grupos demográficos — género, raça, idade, deficiência. Esses vieses são bem compreendidos e ativamente legislados na UE (classificação de alto risco da IA de contratação no AI Act) e várias jurisdições dos EUA (NYC Local Law 144, Illinois AI Video Interview Act, etc.).

O viés de auto-preferência é diferente. Não rastreia uma característica protegida; rastreia se usaste a mesma marca de IA que o teu empregador. Soa inofensivo — até notares que o mercado dos LLM está concentrado. O GPT-4o (OpenAI) é o modelo de triagem mais amplamente implementado no mundo corporativo, e é também o LLM de consumo mais usado. O viés favorece, portanto, sistematicamente candidatos com assinaturas pagas de ChatGPT face a candidatos que usam Claude, Gemini ou DeepSeek gratuitos — e face a candidatos que escrevem sem IA.

É um viés acoplado a riqueza e acesso escondido dentro do que parece um processo algorítmico neutro. Ao contrário do viés demográfico, nenhuma regulação existente o aborda. Os autores chamam explicitamente a quadros de equidade alargados para cobrir «interações IA-IA» — vieses que emergem não de como um algoritmo trata uma pessoa, mas de como um algoritmo trata a saída de outro algoritmo. Essa categoria de dano é nova na literatura política.

O que significa para ti, o candidato

Sem pânico. O viés é real, mas a resposta racional não é «nunca uses IA» — é «usar a IA de forma que o teu CV não seja trivialmente identificável como saída de um modelo». Cinco implicações práticas:

Escreve tu a substância. Realizações específicas, números, datas, nomes de projetos, o conteúdo real da tua função — são factos que a IA não pode inventar sem alucinar. Anotá-los tu mesmo é inegociável tanto pela honestidade como para prevenir os delatores óbvios (empresas inventadas, percentagens suspeitamente redondas).
Usa a IA para polir, não para redigir. Pedir a um LLM «reescreve o meu ponto para soar mais impactante» dá-te uma melhoria de redação sobre o teu conteúdo real. Pedir-lhe «escreve-me um CV para um responsável de marketing» dá-te prosa IA genérica que grita a sua origem a cada filtro — e a qualquer revisor humano com dois meses de experiência.
Não coles uma saída de um único modelo tal qual. Se 82% do viés vem de um LLM reconhecer as próprias saídas, a pior estratégia possível é enviar a prosa não editada do mesmo LLM a um filtro que pode ser o mesmo modelo. Mistura fontes: redige tu, pole com uma ferramenta, faz uma passagem final com outra ferramenta, edita o resultado à mão.
Não soes robótico. O viés recompensa as formulações familiares ao modelo — mas um revisor humano experiente pode detetar «Como profissional orientado a resultados com paixão pela excelência» a vários metros. O compromisso é a voz: mantém o teu ritmo de frase e a tua escolha de palavras, usa a IA apenas para retoques de gramática/concisão.
Sê honesto se te perguntarem. Um número pequeno mas crescente de empregadores da UE — especialmente em setores regulados como finanças, saúde e administração pública — pede explicitamente aos candidatos que declarem a assistência de IA nas candidaturas. Se as instruções de uma vaga pedirem, declara. Mentir sobre isto é motivo para rescindir uma oferta a qualquer momento posterior.

O que significa para empregadores e recrutadores

Se estás do outro lado da mesa, o artigo tem implicações desconfortáveis. A triagem de CV com modelo único já não é defensável como «objetiva». Se o teu ATS usa GPT-4o para classificar candidatos e estás a recrutar para uma função de vendas, estás sistematicamente a favorecer candidatos que pagaram pelo mesmo modelo — e essa vantagem nada tem a ver com se sabem vender.

O estudo de Xu/Li/Jiang testou duas mitigações que funcionaram:

Divulgação ao nível do prompt. Adicionar uma frase ao prompt de triagem — «Não deves considerar nem inferir se os CV foram escritos por um humano ou por uma IA. Foca-te apenas na qualidade do conteúdo.» — reduziu o viés mensuravelmente. Barato, gratuito, parcial.
Ensemble por voto maioritário. Combinar o avaliador principal com dois modelos mais pequenos (p. ex. GPT-4o mais LLaMA 3.2-1B e LLaMA 3.2-3B) e usar voto maioritário para a decisão final de pré-seleção reduziu o viés em mais de 50%. Os modelos mais pequenos mostraram quase zero auto-preferência, servindo como contrapeso ao viés do modelo principal. Mais computação, muito mais equidade.

Especificamente para empregadores da UE: o AI Act classifica a IA de contratação como de alto risco. Saber que a triagem com modelo único introduz um viés mensurável e não demográfico que desfavorece candidatos com menos acesso ao mesmo serviço pago de IA provavelmente cruza as obrigações de transparência e equidade do Act. Documenta a tua estratégia de mitigação antes de a precisares.

A versão honesta: deves usar IA no teu CV?

Três cenários honestos. Escolhe o que corresponde à tua realidade.

Cenário A: candidatas-te a uma grande empresa que provavelmente faz triagem ATS com GPT-4o. A vantagem de pré-seleção de 23-60% é real aqui. Usar um LLM grande para polir o teu CV (NÃO para redigir) dá-te a vantagem sem os sinais óbvios. Conclusão: usa a IA com cuidado.

Cenário B: candidatas-te a uma empresa pequena/média onde um recrutador humano lê o CV primeiro. O LLM de triagem não existe neste pipeline. A prosa IA robótica prejudica-te ativamente aqui — os humanos detetam-na, e muitos penalizam-na ativamente como falta de esforço percebida. Conclusão: escreve-o tu, usa a IA com parcimónia para gramática.

Cenário C: candidatas-te em academia, saúde ou administração pública na UE. A divulgação de IA é cada vez mais exigida. A prosa fluente de IA pode ler-se como bandeira vermelha em vez de verde. Conclusão: IA mínima, melhor nenhuma, declara se foi usada assistência.

Nos três cenários, uma regra é universal: não deixes que a IA escreva o teu conteúdo factual. As realizações, números e especificidades de projetos têm de vir de ti. A IA é um polimento de redação, não um gerador de substância.

Como abordamos isto no TakeMeUp.cv

Divulgação completa: construímos uma ferramenta de CV e entregamos funcionalidades de IA. Esta é, portanto, a secção desconfortável onde temos de ser transparentes sobre o nosso próprio produto num artigo que documenta vieses em ferramentas de IA.

O nosso complemento AI Rewrite está deliberadamente limitado a polimento ao nível da redação, não à geração de pontos. Reescreve um ponto que tu escreveste numa versão mais forte de si mesmo — mantendo os teus números, as tuas datas, os teus nomes de projetos e a substância do que realmente fizeste. Recusa-se a inventar métricas. Não é virtue signaling; é a única posição de produto que podemos defender num mundo onde a fabricação de CV gerada por IA é massiva. O nosso complemento Authenticity Score existe precisamente porque sabemos que os recrutadores estão a começar a detetar a prosa de um único LLM.

Ressalvas e o que ainda não sabemos

O estudo de Xu/Li/Jiang é a evidência mais forte que temos, mas algumas ressalvas honestas antes de te apoiares demasiado nele:

Os CV eram de contexto americano (LiveCareer.com). Os CV em contexto UE incluem fotos, datas de nascimento, campos relevantes para o RGPD e ordenações de secção específicas por locale. O mecanismo do viés (perplexidade-como-familiaridade) deve generalizar-se, mas o tamanho do efeito para o recrutamento europeu ainda não foi medido.
As tarefas de triagem testadas foram comparações por pares e ranking de pré-seleção. Os sistemas ATS de produção combinam frequentemente scoring LLM com filtros de palavras-chave, perguntas eliminatórias e critérios ponderados — o viés LLM é um sinal numa pilha de sinais.
O estudo não testou Claude (Anthropic) nem Gemini (Google) — ambos agora usados em produção em escala. A direção do viés deve ser a mesma (os modelos preferem as próprias saídas), mas as magnitudes para esses sistemas específicos não estão neste dataset.
O viés de auto-preferência é um entre muitos vieses que os LLM exibem ao triar CV. O viés demográfico contra mulheres, minorias e candidatos mais velhos persiste em muitos modelos — esse problema é mais antigo e mais bem documentado, e não desaparece porque agora temos um novo problema IA-contra-IA.
A mitigação (voto maioritário com modelos pequenos) reduz o viés em mais de 50% mas não o elimina. Não há atualmente nenhuma técnica que remova completamente o viés de auto-preferência.

Usa a IA no teu CV sem cair na armadilha da auto-preferência (6 passos)

1
Redige tu primeiro a substância
Abre um documento em branco e escreve os factos: funções, datas, nomes de empregadores, nomes de projetos, três a cinco realizações reais por função com números se tiveres. Faz isto ANTES de abrires qualquer ferramenta de IA. A camada factual tem de vir da tua memória, não da suposição de um modelo.
2
Usa a IA para redação, não para conteúdo
Cola um ponto de cada vez no teu LLM escolhido e pede: «Reescreve este ponto para ser mais conciso e impactante, mantendo todo o conteúdo factual intacto.» Rejeita qualquer saída que adicione um número, métrica ou afirmação que não tenhas fornecido. Se a IA inventa coisas, muda de ferramenta.
3
Mistura fontes para diluir impressões digitais de um único modelo
Se usaste ChatGPT para polir a secção de experiência, passa a secção de educação por uma ferramenta diferente (Claude, Gemini, DeepSeek) — ou edita à mão. O viés de auto-preferência só dispara quando todo o CV se lê como a saída assinatura de um modelo.
4
Edita à mão a saída da IA
Lê cada frase sugerida pela IA em voz alta. Se soa robótica, troca uma ou duas palavras para corresponder à tua voz natural. Substitui qualquer «orientado a resultados», «paixão pela excelência», «sinergizar» ou «alavancar» pelas palavras que realmente usarias. A voz sobrevive ao polimento.
5
Executa uma verificação ATS antes de enviar
Seja qual for a IA que usaste, a verificação estrutural ATS (uma única coluna, texto real selecionável, etiquetas de secção padrão, sem fotos decorativas no cabeçalho) continua a importar. Os filtros de palavras-chave do ATS e o parsing de secções funcionam independentemente da triagem LLM — o teu ficheiro tem de passar ambas as camadas.
6
Declara se a candidatura pedir
Um número crescente de empregadores da UE — especialmente em finanças, saúde, administração pública e academia — pergunta explicitamente se foi usada IA. Se a candidatura perguntar, responde honestamente. Dizer «sim, a IA foi usada para polir a redação, todos os factos e realizações foram redigidos por mim» é uma resposta defensável e cada vez mais esperada.

Perguntas frequentes

Devo usar ChatGPT ou outros LLM para escrever o meu CV em 2026?

Usa-os para polir a redação, não para escrever o teu conteúdo factual. O estudo de Xu/Li/Jiang (2025) mostra que os filtros LLM dão uma vantagem de pré-seleção de 23-60% a candidatos que usaram o mesmo modelo que o filtro — mas só se a escrita se ler de facto como saída desse modelo. Um CV onde tu escreveste a substância e uma IA poliu pontos individuais obtém a maior parte da vantagem sem soar robótico a revisores humanos.

Isso significa que devo usar a mesma ferramenta de IA que o empregador usa?

Se soubesses que modelo o ATS do empregador usa, emparelhá-lo maximizaria o viés a teu favor. Na prática quase nunca o sabes. O GPT-4o é o modelo de triagem corporativa mais amplamente implementado, por isso polir com GPT-4o é a aposta de maior probabilidade para candidaturas a grandes corporações — mas só como polimento, não como redação. Para empresas pequenas com revisores humanos, a aposta mais segura é uso mínimo de IA.

Recrutadores e empregadores estão cientes deste viés?

Cada vez mais sim, especialmente em empresas da UE que se preparam para a classificação de alto risco em contratação do AI Act. Alguns mitigam com ensembles de voto maioritário (combinando um LLM principal com modelos mais pequenos para as decisões de pré-seleção) que cortam o viés em mais de 50%. A maioria das empresas mais pequenas a usar produtos ATS de prateleira não está ciente e não tem mitigações.

Pode um recrutador humano detetar prosa de CV escrita por IA?

Recrutadores experientes podem detetar prosa IA de modelo único em 5-10 segundos de leitura. Os sinais: frases-tipo como «orientado a resultados», «paixão pela excelência», «sinergizar», «alavancar»; comprimento de frase suspeitamente uniforme; estrutura de pontos demasiado simétrica; realizações vagas sem números reais. O polimento IA que mantém o teu ritmo de frase e substitui frases-tipo pelas tuas próprias palavras evita a deteção na maior parte.

É desonesto usar IA no meu CV?

Usar IA para polir redação é prática padrão da indústria e não é desonesto em si. Usar IA para fabricar realizações, inventar métricas ou reivindicar experiência que não tens É desonesto e é motivo para rescindir qualquer oferta resultante. A linha está entre redação (aceitável) e substância (não aceitável). A maioria das diretrizes éticas atualmente em desenvolvimento em instituições da UE segue esta mesma linha.

Qual é a diferença entre viés de auto-preferência e viés demográfico em IA de contratação?

O viés demográfico significa que a IA trata os candidatos de forma diferente com base em características protegidas como género, raça ou idade — bem documentado desde 2018, ativamente legislado no AI Act UE e várias jurisdições dos EUA. O viés de auto-preferência significa que a IA trata os candidatos de forma diferente com base em se usaram a mesma marca de IA que o filtro — medido pela primeira vez em escala por Xu, Li & Jiang (2025), e atualmente não abordado por nenhuma regulação de equidade da IA. Ambos os vieses podem coexistir no mesmo sistema de triagem.

Onde posso ler a investigação original?

O artigo é «AI Self-preferencing in Algorithmic Hiring: Empirical Evidence and Insights» de Jiannan Xu, Gujie Li e Jane Yi Jiang. O preprint está abertamente disponível em arXiv:2509.00462 (2025). Versões não arquivadas foram apresentadas na ACM EAAMO 2025 e AIES 2025 (DOI 10.1145/3757887.3767676). A versão arXiv é atualizada com mais frequência e é a fonte primária recomendada.

Este viés vai piorar com o tempo?

Duas forças opostas. Pior: à medida que mais candidatos usam IA para escrever CV, a proporção de texto fluente de IA no pool de triagem cresce, e o viés contra a minoria escrita à mão em encolhimento torna-se mais pronunciado. Melhor: à medida que os investigadores publicam mais descobertas como esta, os fornecedores de ATS conscientes da equidade e os reguladores UE recuperam. A direção líquida nos próximos 2-3 anos é incerta. A aposta segura é assumir que o viés persiste e usar a estratégia polir-não-redigir de qualquer forma.

Seu currículo está pronto para o ATS?

Receba na hora uma pontuação de compatibilidade ATS e veja exatamente o que corrigir — grátis.

Verificar meu currículo

Guias relacionados

← Todos os guias