chatgpt-si-gemini-nu-trec-clasa.-testul-care-iti-arata-ca-inteligenta-artificiala-mai-are-de-invatat-pana-sa-devina,-cu-adevarat,-inteligenta
0 3 minute 1 an

O nouă provocare în domeniul inteligenței artificiale a demonstrat distanța mare până la atingerea Inteligenței Artificiale Generale (AGI).

Rezultatele testelor recente asupra modelelor de vârf din industrie au scos în evidență limitele actualei tehnologii AI.

Testul ARC-AGI-2: O provocare reală pentru modelele AI moderne

Testul ARC-AGI-2, dezvoltat de Arc Prize Foundation, evaluează progresul spre AGI prin testarea capacității modelelor AI de a rezolva puzzle-uri vizuale. Aceste puzzle-uri necesită recunoaşterea tiparelor, înţelegerea contextului şi raţionament, abilităţi relativ simple pentru oameni, dar extrem de dificile pentru inteligenţa artificială.

Performanţele slabe ale modelelor de top subliniază necesitatea unor progrese semnificative în dezvoltarea unei IA funcţionale.

Modelul avansat al OpenAI, o3-low, a obţinut un scor de doar 4%, în timp ce Gemini 2.0 Flash al Google şi DeepSeek R1 au obţinut scoruri şi mai mici, de 1,3% respectiv. Şi modelul Claude 3.7 al Anthropic a înregistrat un procent redus (0,9%).

Aceste rezultate pun în evidenţă diferenţa semnificativă între inteligenţele specializate şi adevărata inteligenţă generală, capacitatea de învăţare, adaptare şi rezolvare a problemelor noi.

AGI: Un obiectiv încă departe

Discuţia despre realizarea AGI a captat atenţia în ultimii ani. În timp ce unii experţi preconizează o realizare în câţiva ani, alţii susţin că tehnologia actuală nu este suficient de avansată.

În ciuda speranţelor, este evident că mai sunt necesare eforturi substanţiale pentru dezvoltarea unui sistem AI care să rezolve probleme vizuale şi să se comporte la nivelul capacităţilor cognitive umane.

Testul ARC-AGI-2 evidenţiază diferenţa crucială între inteligenţele specializate şi inteligenţa generală. Modelele AI actuale se remarcă în domenii specifice, dar nu pot generaliza cunoştinţele pentru a rezolva probleme noi. Testul pune accentul pe acest tip de raţionament generalizat, mai accesibil oamenilor, dar extrem de dificil pentru AI.

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *