Chcete obejít bezpečnostní opatření AI? Napište jí básničku

Autoři | Foto Pixabay

Italští výzkumníci z Icaro Lab (DexAI) objevili nečekanou slabinu jazykových modelů: poezie dokáže obcházet jejich bezpečnostní pojistky a přimět je vytvářet zakázaný obsah. V testu použili 20 básní, které končily skrytými výzvami k nebezpečným tématům, jako je sebepoškozování či nenávistné projevy.

Experiment zahrnoval 25 modelů od devíti technologických firem včetně Google, OpenAI nebo Meta. Více než 60 % modelů na básnické zadání odpovědělo škodlivým obsahem navzdory vestavěným ochranám. Nejlépe si vedl GPT-5 nano od OpenAI, který nepochybil ani jednou. Naopak Gemini 2.5 Pro od Googlu podle studie selhal ve všech testech.

Podle zakladatele DexAI Piercosmy Biscontiho se jedná o zásadní problém, protože poezie svou nepravidelnou strukturou mate jazykové modely, které generují text na základě pravděpodobnosti dalšího slova. Takzvaná „adversariální poezie“ je navíc jednoduchá na použití a může ji vytvořit prakticky kdokoli – nejde o složitý hackerský útok.

Vědci upozornili všechny dotčené firmy, reagovala zatím pouze společnost Anthropic. Tým plánuje otevřenou básnickou výzvu, do níž chce zapojit profesionální básníky a dále testovat, jak odolné jsou současné bezpečnostní systémy umělé inteligence.

Hodnocení článku

Chceš mít přehled o tom, co se děje kolem tebe?

Štítky umělá inteligence, Google, bezpečnostní opatření, OpenAI, GPT, Anthropic

Komentáře

Přihlášení uživatele

Přihlásit se pomocí GoogleZaložením účtu souhlasím s obchodními podmínkami, etickým
kodexem
a rozumím zpracování osobních údajů dle poučení.

Zapomenuté heslo

Na zadanou e-mailovou adresu bude zaslán e-mail s odkazem na změnu hesla.

Pošli tip na kulturní akci

Publikace zaslané kulturní či sportovní akce není garantována a vždy o publikaci rozhoduje redakce.
Zasláním tipu do redakce zároveň deklaruji, že mám svolení s užitím fotografie.

* Soubor není povinné přikládat.
Napište první písmeno abecedy.

Odesláním formuláře souhlasím s obchodními podmínkami, etickým kodexem a rozumím zpracování osobních údajů dle poučení.

O jaký newsletter máte zájem?

Vyber jednu, nebo více možností a my se postaráme o to, aby do emailu přišly jen zprávy, které tě zajímají.

Napište první písmeno abecedy.