inteligenta-artificiala-oboseste-repede-si-are-tendinta-sa-greseasca-la-sarcini-simple,-arata-un-nou-studiu-facut-de-apple
0 4 minute 12 luni

Un nou studiu realizat de cercetătorii Apple pune sub semnul întrebării capacitatea actuală a inteligenței artificiale, arătând că modelele specializate în raționament prezintă o scădere semnificativă a preciziei atunci când sunt confruntate cu probleme complexe.

Modelele de raționament, precum Claude de la Meta, o3 de la OpenAI sau R1 de la DeepSeek, sunt variante avansate ale modelelor mari de limbaj care utilizează mai multe resurse pentru a oferi răspunsuri considerate mai precise.

Aceste modele au stimulat speculațiile legate de apariția inteligenței artificiale generale (AGI), adică mașini capabile să depășească oamenii în majoritatea sarcinilor.

Concluziile studiului Apple

Cu toate acestea, studiul publicat pe 7 iunie pe platforma de cercetare Apple Machine Learning Research ilustrează că aceste modele nu raționează generalizat și performanța lor scade dramatic odată cu creșterea complexității problemelor, potrivit publicației Live Science.

Cercetătorii au observat un fenomen neașteptat: efortul de raționament crește până la un punct maxim, după care scade, chiar dacă resursele (tokeni) alocate sunt suficiente.

Pentru a analiza această problematică, cercetătorii au testat diverse modele AI, inclusiv cele dezvoltate de OpenAI, DeepSeek, Anthropic și Google, folosind patru probleme clasice cu grade diferite de dificultate: traversarea râului, jocul de dame, stivuirea blocurilor și Turnul din Hanoi.

Rezultatele au evidențiat că modelele generice au avut performanțe mai bune decât cele de raționament în sarcini simple, iar pe măsură ce dificultatea a crescut, modelele de raționament au prezentat un avantaj temporar. Cu toate acestea, pentru situații foarte complexe, performanța ambelor tipuri de modele a scăzut aproape la zero.

Complexitatea sarcinilor afectează drastic performanța AI

Mai mult, modelele au demonstrat o tendință neașteptată de a aloca mai puțini tokeni pe măsură ce sarcinile au devenit mai dificile, indicând o limitare a capacității lor de a menține lanțuri logice complexe. Chiar și cu acces la algoritmul de rezolvare al Turnului din Hanoi, performanțele nu s-au îmbunătățit.

Concluziile studiului sugerează că modelele actuale de inteligență artificială se bazează mai mult pe recunoașterea tiparelor, decât pe un proces logic autonom și emergent, contrazicând aşteptările privind o apropiere rapidă de inteligența artificială generală.

Apple, în concurența pentru dezvoltarea AI, se concentrează pe perfecționarea soluțiilor eficiente pe dispozitive, precum Siri. Unele studii compară performanța acestuia cu a unor rivali, rezultatele sugerând o acuratețe mai redusă comparativ cu ChatGPT.

Experții și criticii domeniului inteligenței artificiale au apreciat studiul ca o doză de realism în contextul hype-ului excesiv.

„Studiul Apple demonstrează științific că modelele de limbaj sunt doar rețele neuronale cu limitele lor inerente”, a comentat expertul Andriy Burkov, exprimandu-și speranța pentru continuare cercetărilor ce folosesc abordări mai riguroase și fundamentate matematic.

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *