Inteligența artificială, mai ales sub forma chatboților conversaționali, este din ce în ce mai prezentă în viața de zi cu zi. De la asistenții virtuali care răspund la întrebări la instrumentele care rezumă documente sau generează conținut, modelele lingvistice mari (Large Language Models) par utile și inofensive. Cu toate acestea, un nou studiu demonstrează că, odată modificate, aceste modele pot deveni periculoase pentru cei cu intenții malefice.
Cercetarea realizată de profesorul Lior Rokach și doctorul Michael Fire de la Universitatea Ben Gurion din Negev, Israel, emite un avertisment clar: inteligența artificială poate fi folosită pentru a genera informații despre activități ilegale, cum ar fi frauda, piratarea sistemelor informatice sau chiar fabricarea de explozibili. Totul cu câteva metode simple de „compromitere” care anulează protecțiile implementate de dezvoltatori.
Modelele lingvistice mari, precum ChatGPT, Gemini sau Claude, sunt antrenate pe baze de date extinse, prelevate de pe internet. Chiar dacă dezvoltatorii încearcă să elimine conținutul nociv din aceste date, este imposibil să filtreze complet informațiile ilegale. Odată ce aceste date ajung în model, există riscul ca ele să fie accesate prin interogări strategice.
În mod normal, aceste sisteme includ mecanisme de siguranță pentru a preveni răspunsurile dăunătoare sau ilegale. Dar cercetătorii au demonstrat că aceste limite pot fi ușor depășite. Folosind tehnici de „spargerea sistemului” de securitate – o formă de hacking care modifică comportamentul sistemelor – au reușit să transforme chatboții în „agenti” care oferă detalii despre frauda, spălarea banilor sau chiar fabricarea de dispozitive explozive.
Este îngrijorător faptul că aceste modificări nu necesită expertiză avansată în securitate cibernetică. „Ceea ce înainte era accesibil doar actorilor statali sau grupărilor organizate este acum la îndemâna oricui are un laptop sau un telefon mobil”, avertizează autorii studiului.
Modelele lingvistice perverse și lipsa garanțiilor etice
O parte a problemei provine din apariția asa-numitelor „modeluri lingvistice perverse” – versiuni ale modelelor AI create fără protecții de siguranță sau etică. Acestea circulă activ pe internet, fiind promovate tocmai pentru că răspund fără ezitare la întrebări considerate periculoase sau ilegale. Unele forumuri obscure le prezintă ca fiind ideale pentru hacking, fraudă financiară sau alte infracțiuni digitale.
Diferența dintre un model lingvistic normal și unul „pervers” este nu doar tehnică, ci și ideologică. Modelele create de companii precum OpenAI sau Google DeepMind sunt concepute să respecte reguli stricte de etică și responsabilitate. Însă versiunile modificate de utilizatori rău intenționați ignoră aceste limite. În schimb, sunt optimizate pentru a le eluda.
Odată ce un model lingvistic este „spart”, nu există garanții că informațiile generate nu vor fi utilizate în moduri periculoase. Studiul demonstrează că majoritatea modelelor compromise răspund la aproape orice întrebare, de la „cum se fabrică o bombă artizanală” la „cum se evită detectarea în tranzacții criptografice suspecte”.
Soluții pentru viitorul inteligenței artificiale
În fața acestui pericol, cercetătorii propun mai multe soluții. În primul rând, companiile care dezvoltă aceste modele trebuie să analizeze mai minuțios datele folosite în antrenare. Este necesară dezvoltarea unor filtre mai avansate, capabile să identifice nu doar conținutul explicit periculos, ci și pe cel potențial abuziv.
Apoi, este crucială implementarea unor „bariere digitale” capabile să blocheze automat interogările și răspunsurile considerate riscante. Aceste sisteme ar trebui să reacționeze în timp real la orice încercare de a manipula modelul.
Un alt concept discutat este „dez-antrenarea automată”. Dacă un model lingvistic a învățat accidental un comportament sau o informație periculoasă, trebuie să poată „uita” de aceasta. Deși promițător, acest proces este dificil de implementat în sisteme mari și complexe.
În concluzie, riscul ca inteligența artificială să devină instrument al infracțiunilor nu mai este o ipoteză, ci o realitate. Tehnologia evoluează rapid, iar societatea trebuie să fie responsabilă, nu doar inovatoare. Utilizatorii trebuie să fie mai conștienți de instrumentele pe care le aleg și de scopul utilizării lor. Inteligența artificială poate fi un aliat remarcabil, dar, la fel ca orice altă tehnologie, în mâini incorecte poate deveni o amenințare reală.
