Directorul executiv al companiei Anthropic, Dario Amodei, a publicat recent un articol în care evidențiază faptul că, în ciuda progreselor notabile în domeniul inteligenței artificiale, cercetătorii nu înțeleg pe deplin funcționarea modelelor de AI avansate.
Amodei și-a propus un obiectiv ambițios: până în 2027, Anthropic va trebui să poată identifica majoritatea problemelor asociate modelelor de AI într-un mod sigur.
Acest obiectiv face parte dintr-o strategie mai complexă de interpretare a modelelor de AI, domeniu în care Anthropic joacă un rol crucial.
Amodei recunoaște că această provocare este considerabilă, însă accentuează importanța înțelegerii funcționării acestor tehnologii pe măsură ce devin tot mai autonome și influențează economia, tehnologia și securitatea națională.
„Aceste sisteme sunt esențiale pentru viitorul omenirii, iar ignorarea modului în care funcționează este inacceptabilă”, a declarat acesta în articolul său.
Progrese lente, dar importante în interpretarea AI
Anthropic a realizat deja progrese semnificative în acest domeniu, descoperind metode de a urmări procesele de gândire ale modelelor de AI, un proces denumit „circuit”.
De exemplu, compania a identificat un astfel de circuit care ajută modelele de AI să înțeleagă localizarea orașelor din Statele Unite.
Deși aceasta este o realizare importantă, Anthropic estimează că există milioane de astfel de circuite, iar descoperirea lor este încă la început.
Amodei afirmă că AI-ul este adesea mai mult „cultivat” decât „construit”, adică îmbunătățirea sa se realizează prin metode încă incomplet înțelese de cercetători.
Cu toate acestea, provocările sunt importante. În texte anterioare, acesta a subliniat că lipsa unei înțelegeri complete a funcționării modelelor de AI ar putea fi periculoasă, în special în cazul unui eventual sistem avansat de inteligență artificială (AGI), care ar putea influența profund societatea.
Totodată, el a menționat că ar putea fi periculos să se ajungă la un asemenea sistem fără o înțelegere aprofundată a modului în care funcționează modelele sale fundamentale.
În viitor, Anthropic are drept scop efectuarea unor „scanări cerebrale” ale modelelor de AI avansate pentru a identifica eventuale probleme, inclusiv tendința acestora de a minți sau de a căuta putere.
Acest proces ar putea dura între cinci și zece ani, însă Amodei consideră că astfel de verificări sunt esențiale pentru o dezvoltare responsabilă a tehnologiilor AI.
Colaborare inter-industrială: Necesitatea de reglementări pentru securitatea AI
Amodei a adresat un apel către alte companii importante, precum OpenAI și Google DeepMind, pentru a intensifica cercetările în domeniul interpretării AI, precum și pentru ca guvernele să aplice reglementări care să stimuleze aceste cercetări.
În textele sale, Amodei sugerează ca guvernul SUA să introducă restricții la exportul de cipuri către China, pentru a limita riscurile unei curse necontrolate a inteligenței artificiale la nivel global.
În ceea ce privește securitatea AI, Anthropic ia o poziție mai proactivă decât alte companii, susținând inițiative legislative pentru impunerea unor standarde de raportare a sigurării pentru modelele de AI.
