Od momentu, kdy byl ChatGPT před třemi lety uveden na scénu, došlo k narušení mnoha odvětví, kde se píše a čte. Sotva byl spuštěn, začaly snahy detekovat jeho otisky v textech. Metody detekce lze rozdělit na místní, které se pokoušejí zjistit, zda byl text generován AI, a globální, které nezkoumají úroveň jednotlivého článku, ale spíše se zaměřují na jazykové trendy v textem generovaných umělou inteligencí.
Několik zřejmých způsobů, jak poznat, že článek byl vygenerován AI, zahrnuje fiktivní odkazy nebo náhodné zařazení frází, jako je „Jako AI jazykový model“. Častěji však vyžadují sofistikovanější metody. Některé z těchto metod vycházejí z statistického měření zvaného perplexity, které v podstatě měří, jak překvapivá je sekvence slov. Texty generované AI mají tendenci mít nižší perplexity a jsou tedy předvídatelnější než texty napsané lidmi.
Metody detekce AI textů
Další metody se zakládají na konceptu vodotisku, což je proces, který skrývá signál v generovaném textu. Jiné využívají algoritmy strojového učení k učení vzorců, které mohou rozlišit mezi texty generovanými AI a těmi psanými lidmi. Ačkoli se tyto metody neustále zlepšují, zatím žádná z nich není dostatečně spolehlivá pro praktické využití. Hlavním problémem je jejich potenciál pro falešně pozitivní výsledky; student by mohl být mylně obviněn z použití AI k dokončení úkolu.
Globální přístup k detekci AI
Globální přístup k detekci přítomnosti AI v textu spočívá v pokusu najít slova, fráze nebo syntaktické vzorce, které jsou spojeny s psaním generovaným AI. Existují dva hlavní způsoby, jak to udělat: porovnání textů napsaných před a po roce 2022, přičemž se hledají zvláštní zvýšení používání konkrétních slov nebo frází, nebo porovnání textů, u nichž víme, že byly napsány lidmi, s texty, které víme, že byly generovány AI.
Občas lze dramatické zvýšení popularity určitého slova vysvětlit událostmi ve světě, například slovy spojenými s pandemií, jako je omikron. Jindy však není zřejmé vysvětlení, což naznačuje, že by mohly být zapojeny modely jazyka jako ChatGPT. Například fráze „Rád bych promluvil“ používaná americkými politiky zaznamenala znatelný nárůst popularity mezi britskými politiky podle analýzy nedávných projevů v britském parlamentu. Možná nejznámějším objevem z této linie výzkumu je zjevná náklonnost ChatGPT k slovu ‚prozkoumat‘ v odborném psaní.
Proměnlivost modelů AI
Huť s porozuměním dopadu ChatGPT na psaní je, že se snažíme pochopit pohyblivý cíl. Modely, které pod něj spadají, se mění každých pár měsíců a společnosti, které tyto modely vyvíjejí, se snaží je učinit stále více podobné lidskému psaní. Pokud tedy „prozkoumat“ je indikátorem textu generovaného AI, mohou být AI modely upraveny tak, aby odpovědi obsahující „prozkoumat“ nebyly upřednostňovány; nebo uživatelé ChatGPT mohou do svých pokynů zahrnout instrukce, aby se tomuto slovu vyhnuli.
Na podporu tohoto tvrzení výzkum Washington Post, který analyzoval více než 300 000 zpráv ChatGPT v období od června 2024 do července 2025, zjistil, že použití slova „prozkoumat“ u ChatGPT klesá. Současně generativní AI mění lidské psaní. Mnoho lidí se cítí nedůvěřivě vůči AI a může se vyhýbat slovům, o nichž ví, že jsou s ním spojena, když píší. Jiní se mohou potýkat s tím, že tyto slova používají častěji, protože jsou jemně ovlivněni články generovanými AI, které čtou. Není snadné tyto různé faktory od sebe oddělit.
Slova a emoji od ChatGPT
Až 70 % všech analyzovaných zpráv ChatGPT obsahovalo emoji, přičemž přibližně třetina z nich obsahovala ✅. Jaká tedy jsou nová oblíbená slova ChatGPT? Podle studie Washington Post jsou nová oblíbená slova ChatGPT „jadro“ a „moderní“. Emojis jsou také velmi oblíbené, zejména emoji mozku 🧠 a symbolu ✅. Fráze „nejen X, ale i Y“ je na vzestupu, stejně jako neformální kontrakce jako „to je“ a „ty jsi“. Symbol pomlčky (—) pokračuje v rostoucí popularitě.
Jak rozpoznat lidský text
A jak můžeme s jistotou vědět, že něco napsal člověk? Jediné, co můžeme dělat, je pokračovat v prozkoumávání základního výzkumu této zcela moderní hádanky ✅🧠.
























