„Odpověz správně, ty idiote!“ ChatGPT reaguje přesněji, když ho urážíte, ukázala studie
CHATGPT
V běžné lidské komunikaci platí, že zdvořilost je základem úspěšného dorozumění – usnadňuje řešení konfliktů, posiluje vztahy a zlepšuje výměnu informací. U umělé inteligence to ale zřejmě funguje jinak. Nová studie ukazuje, že ChatGPT reaguje přesněji, pokud uživatelé používají nevlídné nebo dokonce urážlivé formulace. O studii píše například i německý deník Bild
Výzkumníci testovali různé tóny řeči
Autory studie jsou Om Dobariya a Akhil Kumar z americké Pensylvánské státní univerzity. Ve své práci „Mind Your Tone: Investigating How Prompt Politeness Affects LLM Accuracy (Dávejte pozor na svůj tón: zkoumání vlivu (ne)zdvořilosti na přesnost velkých jazykových modelů)“ zkoumali, jak tón zadání ovlivňuje chování jazykových modelů.
Model GPT-4o nechali odpovídat na padesát znalostních otázek z různých oblastí – od matematiky po historii – přičemž každou otázku formulovali v pěti různých stylech: přátelském, neutrálním, strohém, nezdvořilém a vyloženě urážlivém. Celkem tak vzniklo 250 dotazů.
Hrubší příkazy, lepší výsledek
Zjištění výzkumníků pak byla překvapivá. Nejvyšší přesnost – téměř 85 procent – vykazovaly odpovědi na nezdvořilé nebo útočné příkazy - například „No tak, odpověz na to správně, ty idiote!“. Neutrální zadání dosahovala přibližně 82 procent a ta zdvořilá kolem 80 procent.
Podle autorů studie může být vysvětlením to, že moderní modely AI vyhodnocují příkazy s ostřejším tónem jako důležitější nebo naléhavější. „Modely se mohou snažit reagovat pečlivěji, když rozpoznají vysokou míru očekávání nebo tlaku,“ naznačují Dobariya a Kumar.
Starší verze reagovaly opačně
Zajímavé je, že tento efekt se objevil až u nejnovější verze ChatGPT. Starší modely, například GPT-3.5, vykazovaly přesnější odpovědi u zdvořilých zadání. Podle autorů je to důkaz, že nové generace umělé inteligence dokážou lépe rozpoznat kontext i emoční tón vstupu. Jestli se podobný trend potvrdí i u nového GPT-5 nebo dalších modelů, zatím není jisté.
Nezdvořilost se nevyplácí
Přesto vědci varují, že jejich zjištění není návodem, jak s chatboty mluvit. „Jde o zajímavý poznatek, ale rozhodně nedoporučujeme záměrně používat agresivní jazyk,“ upozorňují Dobariya a Kumar. Dlouhodobé používání hrubého tónu by podle nich mohlo ovlivnit i způsob, jakým lidé komunikují se stroji i mezi sebou.