În ultimii ani, discuțiile despre înlocuirea forței de muncă umane prin inteligența artificială au devenit tot mai alarmante. Cu toate acestea, un experiment recent al cercetătorilor de la Universitatea Carnegie Mellon aduce un realism necesar: inteligența artificială este încă departe de a prelua responsabilitățile profesionale.
Simularea „TheAgentCompany” a creat o echipă complet formată din agenți AI de la companii precum Google, OpenAI, Anthropic și Meta, într-o presupusă firmă de software. Rezultatul a fost un dezastru, demonstrând clar că inteligența artificială actuală nu este pregătită pentru sarcini complexe.
Cum a fost organizată compania și ce sarcini au primit agenții AI?
Cercetătorii au dorit să observe performanțele modelelor de inteligență artificială într-un mediu similar cu cel al unei companii reale de software. Agenții AI au fost distribuiți pe poziții precum analiști financiari, ingineri software și manageri de proiect, fiind integrați în structuri simulate de resurse umane și conducere tehnică.
Sarcinile au variat, incluzând navigarea în arhivele de fișiere, vizitarea virtuală a unor sedii noi și redactarea evaluărilor de performanță a colegilor ingineri. Aceste sarcini par simple pentru modelele promițătoare de autonomie și eficiență.
Cu toate acestea, rezultatele au fost departe de a fi impresionante. Cel mai performant agent AI, Claude 3.5 Sonnet de la Anthropic, a finalizat doar 24% din sarcini. Chiar și această performanță modestă a necesitat o medie de aproape 30 de pași și peste 6 dolari pentru fiecare sarcină.
Care sunt limitările actuale ale inteligenței artificiale?
Experimentul a evidențiat mai multe probleme fundamentale ale agenților AI. În primul rând, aceștia prezintă o lipsă semnificativă de logică operațională și abilități sociale. De asemenea, au întâmpinat dificultăți considerabile în navigarea eficientă în mediul digital.
Un exemplu amuzant este cazul unui agent AI care, neștiind cum să găsească utilizatorul potrivit într-un chat intern, a renumerotat un alt utilizator cu numele persoanei căutate. Această incapabile de înțelegere a contextului a condus la erori și confuzii.
Google Gemini 2.0 Flash a finalizat doar 11,4% din sarcini, având nevoie de peste 40 de pași pentru fiecare reușită. Cel mai slab a fost Nova Pro v1 de la Amazon, cu un procent lamentabil de 1,7% din sarcini.
În esență, inteligența artificială actuală se limitează la un sistem avansat de completare automată, similar cu sugestiile de text de pe telefoane, lipsind capacitatea de a învăța din experiențe sau de a soluționa probleme complexe independent.
Ce impact au aceste rezultate asupra viitorului muncii?
În ciuda promisiunilor marilor companii tehnologice, realitatea demonstrează că inteligența artificială nu constituie momentan o amenințare majoră pentru majoritatea locurilor de muncă. Deși poate gestiona sarcini repetitive sau bine definite, în cazul adaptării, creativității și raționamentului logic, performanța actuală este dezamăgitoare.
Aceasta ar trebui să asigure o oarecare liniște: roboții nu sunt gata să ocupe locurile de muncă. În prezent, inteligența artificială necesită supraveghere umană constantă și nu poate funcționa autonom în medii complexe.
Desigur, imbunătățiri viitoare sunt posibile, dar aceste rezultate confirmă că drumul spre o adevărată autonomie a inteligenței artificiale este mult mai lung și mai provocator decât se dorește a se crede.
