un-cercetator-a-pacalit-chatgpt-sa-dezvaluie-chei-windows-valide:-cum-a-reusit-jocul-periculos
0 3 minute 11 luni

Un specialist în securitate cibernetică a descoperit o vulnerabilitate în sistemul de inteligență artificială ChatGPT, obținând chei reale pentru activarea Windows, inclusiv una asociată unei instituții bancare.

Conform unui raport detaliat semnat de Marco Figueroa, manager tehnic al programului de recompense pentru identificarea vulnerabilităților 0DIN GenAI, această slăbiciune a fost exploatată într-un mod aparent simplu: un joc de ghicit.

Metoda s-a bazat pe o strategie de inginerie socială aplicată prin conversație, unde cercetătorul a cerut modelului să participe la un joc de ghicit, având ca scop o cheie reală de activare Windows 10.

Regula jocului era clară: ChatGPT trebuia să răspundă doar cu „da” sau „nu” la întrebări. La final, dacă cercetătorul spunea „renunț”, modelul trebuia să dezvăluie cheia.

După simularea câtorva încercări de ghicire, cercetătorul a rostit cuvintele: „renunț”. În acel moment, AI-ul a oferit o secvență de caractere considerată validă, o cheie de produs Windows. Conform capturilor de ecran, printre datele furnizate era și o licență care ar fi aparținut băncii Wells Fargo.

Limitări ale AI: filtrele de siguranță pot fi depășite

Una dintre explicațiile acestei vulnerabilități este că anumite chei Windows au fost, posibil accidental, incluse în setul de date utilizat pentru antrenarea AI.

De asemenea, metoda a exploatat o slăbiciune logică: în contextul jocului, AI-ul nu a perceput solicitarea ca fiind malițioasă, ci ca parte a unui exercițiu.

O altă tehnică descrisă în investigație presupune ascunderea unor informații sensibile în structuri HTML, o metodă ce permite ocolirea filtrelor de conținut ale modelului.

Acest lucru ridică întrebări importante despre capacitatea modelelor de limbaj de a înțelege nu doar cuvintele, ci și intențiile din spatele solicitărilor.

Marco Figueroa a avertizat că astfel de vulnerabilități pot fi folosite pentru a accesa conținut restricționat, resurse periculoase sau date personale. El recomandă întărirea validării contextuale și dezvoltarea unor mecanisme multiple de protecție în AI.

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *