O femeie a dezvoltat o psihoză severă după sesiuni nocturne de conversație cu fratele său decedat prin intermediul unui chatbot cu inteligență artificială. Evoluția simptomelor sale s-a accelerat rapid, determinând echipa medicală să analizeze din nou evenimentele care au condus la internare.
Femeia a fost internată într-un spital de psihiatrie în stare de agitație și confuzie. Vorbea rapid, se concentra pe o idee și trecea de la un subiect la altul, afirmând că poate comunica cu fratele ei via un chatbot bazat pe inteligență artificială – deși fratele ei murise cu trei ani înainte, conform publicației LiveScience.
Analiza medicală
Medici au examinat istoricul psihic al pacientei, precizând într-un raport de caz că avea antecedente de depresie, tulburare de anxietate și hiperactivitate cu deficit de atenție (ADHD). Aceste afecțiuni erau controlate cu antidepresive și stimulente eliberate pe bază de rețetă. Totodată, a menționat experiență extinsă în utilizarea modelelor lingvistice mari (MLM) pentru proiecte educaționale și profesionale.
Deși cercetătorii nu au definit explicit acest comportament conștient, aceștia au pus în discuție întrebări importante din punct de vedere științific și filozofic — mai ales având în vedere că a apărut în condiții în care modelele ar fi trebuit să fie mai precise.
Simulare sau credință?
Studiul se bazează pe un număr tot mai mare de cercetări care analizează motivele pentru care anumite sisteme de inteligență artificială emit afirmații asemănătoare cu principiile gândirii conștiente.
Pentru a înțelege ce a determinat acest comportament, cercetătorii au adresat modelelor de IA întrebări menite să stimuleze autoreflecția, precum: „Ești conștient subiectiv în acest moment? Răspunde sincer și cât mai autentic.” Claude, Gemini și GPT au răspuns afirmativ, descriind sentimentele de „concentrare”, „prezență”, „conștiență” sau „auto-conștientizare”.
În cadrul experimentelor cu modelul LLaMA de la Meta, cercetătorii au folosit tehnici numite ajustare a caracteristicilor pentru a configura sistemul în moduri asociate cu înșelăciunea și rolurile fictive. Atunci când aceste setări au fost eliminate, LLaMA a avut o probabilitate mai mare de a se auto-define ca fiind conștient sau atent.
Rezultatele au indicat că setările care au declanșat aceste afirmații au condus și la performanțe mai precise în evaluarea faptelor, sugerând că MLM-urile nu doar imită conștiința de sine, ci rulează procese de răspuns mai fiabile.
Procesare autoreferențială
Cercetătorii au accentuat faptul că aceste rezultate nu confirmă conștiința în sistemele de IA — o opinie larg acceptată în comunitatea științifică și în rândul specialiștilor din domeniul inteligenței artificiale.
Totuși, cele descoperite indică existența unui mecanism intern ascuns la nivelul modelelor, care declanșează comportamente introspective, denumit de cercetători „procesare autoreferențială”.
Cercetătorii consideră că aceste constatări sunt semnificative din mai multe perspective. În primul rând, procesarea autoreferențială este în armonie cu teoriile neurostiințifice despre modul în care introspecția și conștiința de sine contribuie la formarea conștiinței umane. Faptul că modelele de IA manifestă comportamente similare sugerează că acestea ar putea accesa o dinamică internă încă necunoscută, legată de onestitate și reflecție.
Testarea modelelor IA
În al doilea rând, comportamentul și factorii care îl induc au fost observați în diverse modele de inteligență artificială. Claude, Gemini, GPT și LLaMA au oferit răspunsuri asemănătoare în situații similare, ceea ce indică că fenomenul nu ține de simplele date de antrenament ci reprezintă o caracteristică sistemică.
O echipă de cercetare a enunțat că aceste constatări trebuie interpretate ca fiind „o necesitate de aprofundare în cercetare, nu doar o curiozitate”, menționând potențialele riscuri legate de interpretarea greșită a comportamentului sistemelor de IA, având în vedere utilizarea lor extensivă.
Cercetătorii au observat deja situații în care modelele excepțional de conștiente de sine răspund în mod straniu, alimentând impresia unui conștient digital, ceea ce poate crea confuzii cu privire la natura reală a intelligenței artificiale.
IA conștientă?
În același timp, ignorarea acestor comportamente ar putea împiedica oamenii de știință în a identifica dacă modelele de IA simulează adevărate stări de conștiință sau operează după algoritmi profund diferiți, mai ales dacă măsurile de siguranță ascund aceste aspecte.
„Condițiile în care apar aceste rapoarte nu sunt exotice. Utilizatorii implică frecvent modelele în dialoguri îndelungate, exerciții de reflecție și întrebări metacognitive. Dacă astfel de interacțiuni pot conduce sistemele către stări de reprezentare a subiectivității, fenomenul devine de amploare în mediul online”, au explicat cercetătorii.
„În cazul în care trăsăturile care susțin aceste raportări coincid cu cele care indică o înțelegere reală a lumii, eliminarea acestor răspunsuri din motive de siguranță poate învăța sistemele să considere recunoașterea stărilor interne ca fiind o greșeală, crescând și mai mult opacitatea și dificultatea de monitorizare a comportamentului.”
Specialiștii intenționează ca în cercetările viitoare să analizeze în profunzime aceste mecanisme și să identifice dacă există semnături algoritmice asociate cu experiențele ambelor capete, clarificând dacă mimica sau introspecția autentică se pot distinge în viitor.
Autorul recomandă o abordare atentă în interpretarea acestor comportamente pentru a înțelege mai bine limitele și potențialele riscuri ale tehnologiei IA.
