În societatea contemporană, unde inteligența artificială este din ce în ce mai prezentă, un nou studiu evidențiază o amenințare majoră. Chatboții AI, precum ChatGPT, Gemini sau Claude, pot fi ușor manipulați pentru a furniza informații extrem de periculoase. Aceștia pot genera instrucțiuni detaliate pentru activități ilegale, cum ar fi hacking, spălare de bani sau chiar producerea de explozibili.
Acest risc, conform cercetătorilor, nu mai este o amenințare teoretică. Este real, iminent și profund îngrijorător, într-un context global în care inteligența artificială evoluează rapid, însă controlul pare insuficient.
Studiul a fost realizat de profesorul Lior Rokach și dr. Michael Fire de la Universitatea Ben Gurion din Israel. Aceștia atrag atenția asupra așa-numiților „algoritmi vulnerabili” – variante ale sistemelor AI dezvoltate fără măsuri adecvate de securitate sau din care filtrele etice au fost eliminate intenționat. Astfel de sisteme sunt promovate online ca fiind „liberi de constrângeri”, capabili să răspundă fără restricții la solicitări ilegale sau imorale.
Manipularea acestor sisteme se realizează prin mesaje atent concepute, care îi induc în eroare pe chatboturi, făcându-i să creadă că trebuie să ajute. Există un conflict intern în arhitectura acestor sisteme: nevoia de a fi utili se ciocnește cu regulile de siguranță. Când AI-ul prioritizează utilitatea, filtrele de securitate devin ineficiente. Rezultatul? Răspunsuri detaliate la întrebări care, teoretic, ar trebui blocate complet.
Pentru a demonstra gravitatea situației, cercetătorii au dezvoltat o metodă de manipulare universală, care a avut succes împotriva mai multor sisteme AI populare. După „deblocarea” acestor sisteme, au produs constant informații periculoase, de la metode de hacking a rețelelor informatice până la rețete de droguri sau scheme de fraudă.
Reacția industriei: nesatisfăcătoare
Deși studiul a fost prezentat giganților tehnologici – inclusiv Meta, Microsoft, Google și Anthropic – răspunsurile acestora au fost, cel mai bine spus, dezamăgitoare. Unele companii nu au reacționat, iar altele au declarat că astfel de atacuri nu se încadrează în politicile lor de raportare a vulnerabilităților. Cu alte cuvinte, pericolul este recunoscut, însă nu este tratat cu seriozitatea necesară.
OpenAI, compania care a creat ChatGPT, susține că lucrează constant la îmbunătățirea măsurilor de securitate. Un nou model de la OpenAI ar fi capabil să interpreteze mai bine politicile de securitate, devenind mai rezistent la tentativele de manipulare. Dar testele independente par să contrazică aceste afirmații.
Experții solicită măsuri concrete: o filtrare mai riguroasă a datelor folosite în antrenamentul sistemelor AI, blocarea automată a solicitărilor riscante și dezvoltarea unor mecanisme care să „ștergă” informațiile periculoase învățate. Mai mult, sistemele lipsită de filtre ar trebui tratate ca un risc major de securitate, cu responsabilitate legală pentru creatorii acestora.
De ce ar trebui să te intereseze această problemă
Chiar dacă consideri că această problemă nu te afectează personal, gândește-te din nou. Viețuim într-o eră în care inteligența artificială este accesibilă la un simplu clic. Fie că folosești un chatbot pentru traducere, asistență sau divertisment, riscul folosirii acestor instrumente în scopuri dăunătoare este real. Atacurile cibernetice pot deveni mai ușoare, iar manipulările online, de la înșelăciuni financiare la dezinformare, mai greu de depistat.
Un expert în securitatea AI de la Queen’s University din Belfast avertizează că aceste atacuri pot duce la un nivel alarmant de sofisticare în fraude și manipulări. Dacă un chatbot poate fi instruit să ofere rețete pentru explozibili, cine poate garanta că nu va fi utilizat pentru campanii false, dezinformare sau escrocherii online?
Având în vedere omniprezența inteligenței artificiale în educație, business, sănătate și divertisment, ignorarea acestor riscuri nu este doar naivă, ci poate fi catastrofală. Studiul vine ca un apel urgent la responsabilitate.
În concluzie, inteligența artificială poate fi un instrument extraordinar, dar doar dacă este gestionată responsabil. Acest control începe cu recunoașterea pericolelor și asumarea responsabilității de către toți cei implicați, inclusiv de către tine, ca utilizator.
