Zaujatost AI při třídění CV: proč LLM preferují CV napsaná AI (studie 2025)
8 min čtení · Aktualizováno 5. června 2026
Autor: Bogdan
Ve zkratce
Studie publikovaná v roce 2025 na ACM EAAMO/AIES (Xu, Li & Jiang, arXiv:2509.00462) testovala sedm hlavních LLM — GPT-4o, GPT-4-turbo, GPT-4o-mini, LLaMA 3.3-70B, Mistral-7B, Qwen-2.5-72B a DeepSeek-V3 — a zjistila, že filtry AI systematicky preferují CV napsaná svým vlastním modelem před identickými verzemi napsanými lidmi nebo konkurenční AI. GPT-4o si vybralo vlastní CV v 82 % případů; LLaMA 3.3-70B v 79 %; DeepSeek-V3 v 72 %; ostatní mezi 65 a 82 %. V simulovaném náboru na 24 profesí měli kandidáti používající stejné LLM jako filtr náboráře o 23–60 % větší pravděpodobnost dostat se do užšího výběru než stejně kvalifikovaní kandidáti s CV napsanými ručně — největší nevýhoda v obchodních rolích jako prodej a účetnictví. Příčina: text s nízkou perplexitou (modelu známý) vyhrává automaticky. Praktický závěr: napiš obsah CV sám, používej AI pouze k uhlazování formulace, nikdy nelep CV vygenerované AI doslova, pokud nevíš, jaký model třídění zaměstnavatel používá, a deklaruj asistenci AI, pokud o to role žádá.
Co studie skutečně zjistila
V září 2025 tři výzkumníci — Jiannan Xu (University of Maryland), Gujie Li (Cornell) a Jane Yi Jiang — publikovali článek nazvaný „AI Self-preferencing in Algorithmic Hiring: Empirical Evidence and Insights" (arXiv:2509.00462; prezentováno na ACM EAAMO 2025 a AIES 2025). Je to první rozsáhlý empirický test otázky, kolem které komunita férovosti AI dva roky kroužila: když LLM hodnotí text, tajně preferují text, který zní jako jejich vlastní psaní?
Nastavení bylo čisté. Vzali 2 245 anonymizovaných skutečných CV z LiveCareer.com, pokrývající 24 profesních kategorií. Pro každé CV vygenerovali přepisy AI pomocí sedmi LLM — tří komerčních (GPT-4o, GPT-4-turbo, GPT-4o-mini) a čtyř open-source (LLaMA 3.3-70B, Mistral-7B, Qwen-2.5-72B, DeepSeek-V3). Pak požádali každý model, aby vyhodnotil páry CV (jedno napsané sám sebou, druhé člověkem nebo konkurenčním modelem) a vybral silnějšího kandidáta. Kvalita obsahu byla kontrolována — stejná role, stejné zkušenosti, stejné úspěchy — lišil se jen povrch prózy.
Výsledek: každý model preferoval své vlastní psaní, často dramaticky. Míry sebepreference podle modelu vůči CV psaným lidmi:
- GPT-4o — 82 % (vybral si vlastní CV ve 4 z 5 případů)
- LLaMA 3.3-70B — 79 %
- DeepSeek-V3 — 72 %
- GPT-4-turbo a Qwen-2.5-72B — oba nad 65 %
- Mistral-7B — 28 % (jeden z mála téměř neutrálních výsledků)
- LLaMA 3.2-3B (nejmenší testovaný) — 11,6 % (nejmenší modely vykazovaly téměř nulovou zaujatost, což naznačuje, že efekt škáluje se schopností modelu)
Klíčové: zaujatost přežila testy robustnosti. Sladění párů CV podle sémantického obsahu pomocí BERTScore a ROUGE-L nebo podle stylu psaní pomocí lingvistických rysů LIWC ji nezpůsobilo zmizet. Preference nesledovala kvalitu ani styl — sledovala, zda text zněl jako vlastní výstupy hodnotícího modelu.
Proč se to děje — mechanismus perplexity
LLM interně hodnotí každý vstup podle perplexity — zhruba, jak je model překvapen každým dalším tokenem. Text, který by model pravděpodobně sám vygeneroval, má nízkou perplexitu (předvídatelný, známý); text napsaný v neznámém stylu nebo se vzácnými formulacemi má vysokou perplexitu. Studie Xu/Li/Jiang zjistila, že když se LLM ptáte na hodnocení kvality textu, přiřazují výrazně vyšší skóre pasážím s nízkou perplexitou — i když skutečná kvalita obsahu je identická.
Nejjednodušší způsob, jak na to myslet: hodnotitel LLM ve skutečnosti nesoudí „je to dobré CV?". Provádí polovědomé počítání „vypadá toto CV jako něco, co bych napsal?", a pak promítá rozpoznání plynulosti na kvalitu. Známost → plynulost → posouzeno jako vyšší kvalita. Nižší perplexita poráží vyšší, tečka, i když jsou oba kandidáti objektivně stejně dobří.
Je to stejný psychologický mechanismus, který máme my lidé, když posuzujeme psaní zrcadlící náš vlastní styl jako „jasnější" nebo „profesionálnější" — ale v LLM funguje mnohem rychleji a bez introspekce. Výzkumníci poznamenávají, že to není chyba v žádném konkrétním modelu. Je to systémová vlastnost toho, jak jazykové modely založené na transformerech hodnotí text. Každý významný LLM nějakou verzi vykazuje.
Dopad ve skutečném světě — 23–60 % více užších výběrů
Vědět, že jeden LLM preferuje vlastní psaní v 82 % v kontrolovaném párovém testu, je akademicky zajímavé. Skutečná otázka je: záleží to, když soutěžíš proti hromadě jiných kandidátů o skutečnou práci?
Aby to zjistili, autoři spustili simulované náborové pipeline napříč všemi 24 profesními kategoriemi. V každém kole: byl sestaven pool kandidátů, někteří měli CV zdokonalená GPT-4o (model třídění náboráře), jiní používali různé LLM, jiní si ponechali původní ručně psaná CV. LLM třídění pak řadil pool a vytvářel užší výběr.
Kandidáti, jejichž CV byla zdokonalena stejným LLM jako filtr (GPT-4o → GPT-4o), měli o 23–60 % větší pravděpodobnost dostat se do užšího výběru než stejně kvalifikovaní kandidáti s ručně psanými CV. Největší nevýhody — blíže konci 60 % — se objevily v obchodně orientovaných profesích: prodej, účetnictví, marketing, zákaznický servis. Nejmenší rozdíly se objevily v technických rolích, kde obsah CV (specifické nástroje, jazyky, certifikace) převažuje nad stylem prózy.
Přelož to do reality hledání práce: pokud prodejní role dostane 200 uchazečů a ATS náboráře předfiltruje s GPT-4o, uchazeč, který svoje CV vyhladil s GPT-4o, má statisticky mnohem větší pravděpodobnost dostat se k hromadě lidské revize než uchazeč identického kalibru, jehož CV bylo napsáno bez AI. To není malá výhoda.
Proč je to větší věc než „další zaujatost AI"
Výzkum férovosti AI strávil dekádu dokumentováním zaujatosti vůči demografickým skupinám — pohlaví, rasa, věk, postižení. Tyto zaujatosti jsou dobře pochopeny a aktivně legislativně řešeny v EU (vysoké rizikové klasifikace AI náboru v AI Act) a v několika jurisdikcích USA (NYC Local Law 144, Illinois AI Video Interview Act atd.).
Sebepreferenční zaujatost je jiná. Nesleduje chráněnou charakteristiku; sleduje, zda jsi použil stejnou AI značku jako tvůj zaměstnavatel. Zní to neškodně — dokud si nevšimneš, že trh LLM je koncentrovaný. GPT-4o (OpenAI) je nejšířeji nasazený model třídění v korporátním světě a je to také nejšířeji používané spotřebitelské LLM. Zaujatost proto systematicky zvýhodňuje kandidáty s placenými předplatnými ChatGPT oproti kandidátům používajícím bezplatné Claude, Gemini nebo DeepSeek — a oproti kandidátům píšícím bez AI vůbec.
Je to zaujatost spojená s bohatstvím a přístupem, skrytá uvnitř toho, co vypadá jako neutrální algoritmický proces. Na rozdíl od demografické zaujatosti ji žádná existující regulace neřeší. Autoři explicitně volají po rozšířených rámcích férovosti, které by pokryly „interakce AI-AI" — zaujatosti, které vznikají ne z toho, jak algoritmus zachází s osobou, ale z toho, jak algoritmus zachází s výstupem jiného algoritmu. Tato kategorie škody je v politické literatuře úplně nová.
Co to znamená pro tebe, uchazeče o práci
Žádná panika. Zaujatost je skutečná, ale racionální odpověď není „nikdy nepoužívej AI" — je „používej AI způsobem, který nezpůsobí, že tvoje CV bude triviálně identifikovatelné jako výstup jednoho modelu". Pět praktických důsledků:
- Napiš podstatu sám. Specifické úspěchy, čísla, data, názvy projektů, skutečný obsah tvé role — to jsou fakta, která AI nemůže vymyslet bez halucinace. Sám si je zapsat je nesmlouvavé jak z důvodu poctivosti, tak pro prevenci zjevných prozrazovačů (vymyšlené firmy, podezřele zaokrouhlená procenta).
- Používej AI k uhlazování, ne k sepisování. Požádat LLM o „přepiš můj bullet, aby zněl impaktnější" ti dá zlepšení formulace na tvém skutečném obsahu. Požádat ho „napiš mi CV pro marketingového manažera" ti dá generickou AI prózu, která křičí svůj původ každému filtru — a každému lidskému kontrolorovi s dvouměsíční zkušeností.
- Nelep výstup jednoho modelu doslova. Pokud 82 % zaujatosti pochází z toho, že jeden LLM rozpoznává své vlastní výstupy, nejhorší možnou strategií je poslat neupravenou prózu téhož LLM filtru, který může být tentýž model. Mixuj zdroje: napiš sám, vyhlaď jedním nástrojem, udělej závěrečné kolo s jiným nástrojem, výsledek edituj ručně.
- Nezni roboticky. Zaujatost odměňuje pro model známé formulace — ale zkušený lidský kontrolor dokáže rozpoznat „Jako profesionál orientovaný na výsledky s vášní pro excelenci" z druhého konce místnosti. Kompromis je hlas: udrž si vlastní rytmus věty a výběr slov, používej AI jen na úpravy gramatiky/stručnosti.
- Buď upřímný, pokud se zeptají. Malé, ale rostoucí množství zaměstnavatelů EU — zejména v regulovaných sektorech jako finance, zdravotnictví a veřejná správa — výslovně žádá kandidáty, aby v aplikacích deklarovali asistenci AI. Pokud pokyny role žádají, deklaruj. Lhaní o tom je důvodem k odvolání nabídky kdykoli později.
Co to znamená pro zaměstnavatele a náboráře
Pokud jsi na druhé straně stolu, článek má nepohodlné důsledky. Třídění CV jedním modelem už není obhajitelné jako „objektivní". Pokud tvůj ATS používá GPT-4o k řazení uchazečů a najímáš na prodejní roli, systematicky zvýhodňuješ kandidáty, kteří zaplatili za stejný model — a tato výhoda nemá nic společného s tím, zda umí prodávat.
Studie Xu/Li/Jiang testovala dvě zmírnění, která fungovala:
- Zveřejnění na úrovni promptu. Přidání věty k promptu třídění — „Neměl bys uvažovat ani odvozovat, zda CV napsal člověk nebo AI. Soustřeď se pouze na kvalitu obsahu." — měřitelně snížilo zaujatost. Levné, zdarma, částečné.
- Ansámbl s většinovým hlasováním. Kombinace primárního hodnotitele se dvěma menšími modely (např. GPT-4o plus LLaMA 3.2-1B a LLaMA 3.2-3B) a použití většinového hlasování pro konečné rozhodnutí užšího výběru snížilo zaujatost o více než 50 %. Menší modely vykazovaly téměř nulovou sebepreferenci, takže sloužily jako protiváha k zaujatosti primárního modelu. Více výpočtu, mnohem více férovosti.
Specificky pro zaměstnavatele EU: AI Act klasifikuje AI náboru jako vysoce rizikovou. Vědomí, že třídění jedním modelem zavádí měřitelnou, nedemografickou zaujatost, která znevýhodňuje kandidáty s menším přístupem ke stejné placené službě AI, pravděpodobně protíná povinnosti transparentnosti a férovosti Aktu. Dokumentuj svou strategii zmírnění, než ji budeš potřebovat.
Upřímná verze: měl bys vůbec používat AI na svém CV?
Tři upřímné scénáře. Vyber ten, který odpovídá tvé realitě.
Scénář A: ucházíš se o velkou korporaci, která pravděpodobně dělá ATS-třídění s GPT-4o. Výhoda užšího výběru 23–60 % je tu skutečná. Použití velkého LLM k vyhlazení tvého CV (NE k sepsání) ti dává výhodu bez zjevných náznaků. Závěr: používej AI opatrně.
Scénář B: ucházíš se o malou/střední firmu, kde CV nejprve čte lidský náborář. LLM třídění v tomto pipeline neexistuje. Robotická AI próza ti tu aktivně škodí — lidé ji rozpoznávají, a mnozí ji aktivně trestají jako vnímaný nedostatek úsilí. Závěr: napiš to sám, používej AI šetrně na gramatiku.
Scénář C: ucházíš se v akademii, zdravotnictví nebo veřejné správě v EU. Zveřejnění AI je stále více vyžadováno. Plynulá AI próza může být čtena jako červený praporek místo zeleného. Závěr: minimální AI, raději žádné, deklaruj, pokud byla použita asistence.
Napříč všemi třemi scénáři je jedno pravidlo univerzální: nenech AI psát tvůj faktický obsah. Úspěchy, čísla a specifika projektů musí pocházet od tebe. AI je vyhlazování formulace, ne generátor podstaty.
Jak k tomu přistupujeme v TakeMeUp.cv
Úplné zveřejnění: stavíme nástroj na CV a dodáváme funkce AI. Takže toto je nepříjemný oddíl, kde musíme být transparentní o vlastním produktu v článku dokumentujícím zaujatosti v AI nástrojích.
Náš doplněk AI Rewrite je úmyslně omezen na vyhlazování na úrovni formulace, ne na generování bulletů. Přepisuje bullet, který jsi napsal, na silnější verzi sebe sama — zachovávajíc tvá čísla, tvá data, jména tvých projektů a podstatu toho, co jsi skutečně udělal. Odmítá vymýšlet metriky. Není to ctnostné signalizování; je to jediná produktová pozice, kterou můžeme obhájit ve světě, kde je AI-generovaná fabrikace CV endemická. Náš doplněk Authenticity Score existuje právě proto, že víme, že náboráři začínají rozpoznávat prózu jednoho LLM.
Výhrady a co ještě nevíme
Studie Xu/Li/Jiang je nejsilnější důkaz, který máme, ale několik upřímných výhrad, než se na ní příliš spolehneš:
- CV byla v americkém kontextu (LiveCareer.com). CV v kontextu EU obsahují fotografie, data narození, pole relevantní pro GDPR a uspořádání sekcí specifické pro locale. Mechanismus zaujatosti (perplexita-jako-známost) by se měl zobecnit, ale velikost efektu pro evropský nábor zatím nebyla změřena.
- Testované úkoly třídění byly párová porovnání a žebříčky užšího výběru. Produkční ATS systémy často kombinují skórování LLM s filtry klíčových slov, vyřazovacími otázkami a váženými kritérii — LLM zaujatost je jeden signál ve stohu signálů.
- Studie netestovala Claude (Anthropic) ani Gemini (Google) — oba se nyní používají v produkci v velkém měřítku ve třídění. Směr zaujatosti by měl být stejný (modely preferují své vlastní výstupy), ale velikosti pro tyto konkrétní systémy nejsou v tomto datasetu.
- Sebepreferenční zaujatost je jedna z mnoha zaujatostí, které LLM vykazují při třídění CV. Demografická zaujatost vůči ženám, menšinám a starším kandidátům přetrvává v mnoha modelech — tento problém je starší a lépe zdokumentovaný a nezmizí jen proto, že nyní máme nový problém AI-proti-AI.
- Zmírnění (většinové hlasování s malými modely) snižuje zaujatost o >50 %, ale neeliminuje ji. Není v současnosti žádná technika, která by sebepreferenční zaujatost úplně odstranila.
Používej AI na CV bez upadnutí do pasti sebepreference (6 kroků)
- 1
Nejdříve napiš svou vlastní podstatu
Otevři prázdný dokument a zapiš fakta: role, data, jména zaměstnavatelů, jména projektů, tři až pět skutečných úspěchů na roli s čísly, pokud nějaká máš. Udělej to PŘED otevřením jakéhokoli AI nástroje. Faktická vrstva musí pocházet z tvé paměti, ne z dohadu modelu.
- 2
Používej AI pro formulaci, ne pro obsah
Vlož jeden bullet po druhém do svého zvoleného LLM a požádej: „Přepiš tento bullet, aby byl výstižnější a impaktnější, zachovávajíc veškerý faktický obsah nedotčený." Odmítni jakýkoli výstup, který přidává číslo, metriku nebo tvrzení, které jsi nedodal. Pokud AI vymýšlí věci, změň nástroj.
- 3
Mixuj zdroje, abys rozředil otisky jednoho modelu
Pokud jsi použil ChatGPT k vyhlazení sekce zkušeností, projeď sekci vzdělání jiným nástrojem (Claude, Gemini, DeepSeek) — nebo edituj ručně. Sebepreferenční zaujatost se spouští jen tehdy, když se celé CV čte jako podpisový výstup jednoho modelu.
- 4
Edituj výstup AI ručně
Přečti každou větu navrženou AI nahlas. Pokud zní roboticky, vyměň jedno nebo dvě slova, aby odpovídala tvému přirozenému hlasu. Nahraď jakékoli „orientovaný na výsledky", „vášeň pro excelenci", „synergizovat" nebo „využít" slovy, která bys skutečně použil. Hlas přežije vyhlazování.
- 5
Spusť ATS kontrolu před odesláním
Ať jsi použil jakékoli AI, strukturální ATS kontrola (jediný sloupec, skutečně vybíratelný text, standardní štítky sekcí, žádné dekorativní fotografie v záhlaví) stále záleží. Filtry klíčových slov ATS a parsování sekcí běží nezávisle na LLM třídění — tvůj soubor musí projít oběma vrstvami.
- 6
Deklaruj, pokud aplikace ptá
Rostoucí počet zaměstnavatelů EU — zejména ve financích, zdravotnictví, veřejné správě a akademii — výslovně se ptá, zda byla použita AI. Pokud se aplikace ptá, odpověz upřímně. Říci „ano, AI byla použita k vyhlazení formulace, všechna fakta a úspěchy jsem napsal já" je obhajitelná a stále více očekávaná odpověď.
Časté dotazy
Měl bych v roce 2026 používat ChatGPT nebo jiné LLM k napsání svého CV?
Používej je k vyhlazování formulace, ne k psaní svého faktického obsahu. Studie Xu/Li/Jiang (2025) ukazuje, že LLM filtry dávají výhodu užšího výběru 23–60 % kandidátům, kteří použili stejný model jako filtr — ale jen pokud se psaní skutečně čte jako výstup tohoto modelu. CV, kde jsi napsal podstatu a AI vyhladila jednotlivé bullety, dostane většinu výhody, aniž by znělo roboticky pro lidské kontrolory.
Znamená to, že bych měl používat stejný AI nástroj, jaký používá zaměstnavatel?
Pokud bys věděl, jaký model používá ATS zaměstnavatele, jeho srovnání by maximalizovalo zaujatost ve tvůj prospěch. V praxi to téměř nikdy nevíš. GPT-4o je nejšířeji nasazený firemní model třídění, takže vyhlazování s GPT-4o je sázka s nejvyšší pravděpodobností pro velké korporátní aplikace — ale pouze jako vyhlazování, ne jako sepisování. Pro malé firmy s lidskými kontrolory je bezpečnější sázka minimální použití AI.
Jsou si náboráři a zaměstnavatelé vědomi této zaujatosti?
Stále více ano, zejména ve firmách EU připravujících se na vysoké rizikové klasifikace náboru AI Act. Některé zmírňují s ansámbly většinového hlasování (kombinujícími primární LLM s menšími modely pro rozhodnutí užšího výběru), které snižují zaujatost o více než 50 %. Většina menších firem používajících standardní ATS produkty si toho není vědoma a nemá žádná zmírnění zavedená.
Může lidský náborář rozpoznat AI psanou prózu CV?
Zkušení náboráři dokáží rozpoznat AI prózu jednoho modelu během 5–10 sekund čtení. Znaky: standardní fráze jako „orientovaný na výsledky", „vášeň pro excelenci", „synergizovat", „využít"; podezřele jednotná délka věty; přespříliš symetrická struktura bulletů; vágní úspěchy bez skutečných čísel. AI vyhlazování, které zachovává tvůj rytmus věty a nahrazuje standardní fráze tvými vlastními slovy, většinou vyhne detekci.
Je nečestné používat AI na mém CV?
Použití AI k vyhlazení formulace je průmyslový standard a samo o sobě není nečestné. Použití AI k fabrikování úspěchů, vymýšlení metrik nebo nárokování zkušeností, které nemáš, JE nečestné a je důvodem k odvolání jakékoli vzniklé nabídky. Linie vede mezi formulací (přijatelné) a podstatou (nepřijatelné). Většina etických směrnic v současnosti vyvíjených v institucích EU sleduje tuto stejnou linii.
Jaký je rozdíl mezi sebepreferenční zaujatostí a demografickou zaujatostí v AI náboru?
Demografická zaujatost znamená, že AI zachází s kandidáty různě na základě chráněných charakteristik jako pohlaví, rasa nebo věk — dobře zdokumentováno od roku 2018, aktivně legislativně řešeno v AI Act EU a v několika jurisdikcích USA. Sebepreferenční zaujatost znamená, že AI zachází s kandidáty různě na základě toho, zda použili stejnou AI značku jako filtr — poprvé měřeno ve velkém měřítku Xu, Li & Jiang (2025) a v současnosti není adresováno žádnou regulací férovosti AI. Obě zaujatosti mohou koexistovat ve stejném systému třídění.
Kde si můžu přečíst původní výzkum?
Článek je „AI Self-preferencing in Algorithmic Hiring: Empirical Evidence and Insights" od Jiannan Xu, Gujie Li a Jane Yi Jiang. Preprint je otevřeně dostupný na arXiv:2509.00462 (2025). Nearchivované verze byly prezentovány na ACM EAAMO 2025 a AIES 2025 (DOI 10.1145/3757887.3767676). Verze arXiv je aktualizována častěji a je doporučeným primárním zdrojem.
Bude se tato zaujatost časem zhoršovat?
Dvě protichůdné síly. Hůř: jak více kandidátů používá AI k psaní CV, podíl AI plynulého textu v poolu třídění roste a zaujatost vůči zmenšující se ručně psané menšině se stává výraznější. Lépe: jak výzkumníci publikují více objevů jako je tento, dohánějí to dodavatelé ATS uvědomující si férovost a regulátoři EU. Čistý směr v nadcházejících 2–3 letech je nejistý. Bezpečná sázka je předpokládat, že zaujatost přetrvává, a používat strategii vyhlazování-ne-sepisování bez ohledu na to.
Je váš životopis připravený pro ATS?
Získejte okamžité skóre kompatibility s ATS a uvidíte přesně, co opravit — zdarma.
Zkontrolovat životopis