{"id":246029,"date":"2026-03-13T09:03:40","date_gmt":"2026-03-13T09:03:40","guid":{"rendered":"https:\/\/bm.dev.synology.me\/?p=246029"},"modified":"2026-03-13T09:03:40","modified_gmt":"2026-03-13T09:03:40","slug":"ultimul-examen-al-umanitatii-cel-mai-dificil-test-de-inteligenta-artificiala-creat-de-cercetatori","status":"publish","type":"post","link":"https:\/\/bm.dev.synology.me\/?p=246029","title":{"rendered":"\u201eUltimul examen al umanit\u0103\u0163ii\u201d, cel mai dificil test de inteligen\u0163\u0103 artificial\u0103 creat de cercet\u0103tori"},"content":{"rendered":"<p>\nEvalu\u0103ri bine cunoscute, precum examenul Massive Multitask Language Understanding (MMLU), care anterior era considerat exigent, nu mai reu\u015fesc s\u0103 m\u0103soare \u00een mod adecvat capacit\u0103\u0163ile modelelor avansate de IA din prezent, potrivit ScienceDaily.<\/p>\n<p>\nPentru a rezolva aceast\u0103 problem\u0103, un grup interna\u0163ional format din aproape 1.000 de cercet\u0103tori a dezvoltat un nou tip de test. Obiectivul lor era s\u0103 creeze un examen cuprinz\u0103tor, dificil \u015fi bazat pe cuno\u015ftin\u0163ele umane specializate, pe care sistemele actuale de IA \u00eenc\u0103 nu le pot gestiona.<\/p>\n<p>\nRezultatul este \u201eHumanity&#8217;s Last Exam\u201d (n.r &#8211; \u201eUltimul examen al umanit\u0103\u0163ii\u201d), o evaluare cu 2.500 de \u00eentreb\u0103ri care acoper\u0103 matematica, \u015ftiin\u0163ele umaniste, \u015ftiin\u0163ele naturale, limbile antice \u015fi o gam\u0103 larg\u0103 de domenii academice foarte specializate.<\/p>\n<p>\nScopul examenului nu a fost acela de a p\u0103c\u0103li sau de a \u00eenvinge participan\u0163ii umani. \u00cen schimb, obiectivul a fost acela de a identifica cu aten\u0163ie domeniile \u00een care sistemele de IA \u00eenc\u0103 sunt deficitare.<\/p>\n<p>\nSpeciali\u015fti din \u00eentreaga lume au redactat \u015fi revizuit \u00eentreb\u0103rile incluse \u00een Humanity&#8217;s Last Exam. Fiecare problem\u0103 a fost conceput\u0103 cu aten\u0163ie, astfel \u00eenc\u00e2t s\u0103 aib\u0103 un r\u0103spuns clar \u015fi verificabil. \u00centreb\u0103rile au fost elaborate pentru a \u00eempiedica g\u0103sirea de solu\u0163ii rapide prin simple c\u0103ut\u0103ri pe internet.<\/p>\n<p>\nSubiectele provin din provoc\u0103ri academice avansate. Unele sarcini implic\u0103 traducerea inscrip\u0163iilor antice din Palmyra, \u00een timp ce altele necesit\u0103 identificarea structurilor anatomice minuscule ale p\u0103s\u0103rilor sau analizarea caracteristicilor detaliate ale pronun\u0163iei ebraice biblice.<\/p>\n<p>\nCercet\u0103torii au testat fiecare \u00eentrebare cu ajutorul sistemelor de IA de v\u00e2rf. Dac\u0103 un model era capabil s\u0103 r\u0103spund\u0103 corect la o \u00eentrebare, acea \u00eentrebare era eliminat\u0103 din examenul final. Acest proces a asigurat c\u0103 testul a r\u0103mas pu\u0163in peste ceea ce sistemele actuale de IA pot rezolva \u00een mod fiabil.<\/p>\n<p>\nTestele ini\u0163iale au confirmat c\u0103 strategia a func\u0163ionat. Chiar \u015fi modelele puternice de IA au avut dificult\u0103\u0163i cu examenul. GPT-4o a ob\u0163inut un scor de 2,7%, \u00een timp ce Claude 3.5 Sonnet a atins 4,1%. Modelul o1 al OpenAI a avut o performan\u0163\u0103 ceva mai bun\u0103, cu 8%. Cele mai performante sisteme de p\u00e2n\u0103 acum, inclusiv Gemini 3.1 Pro \u015fi Claude Opus 4.6, au atins niveluri de precizie \u00eentre aproximativ 40% \u015fi 50%.<\/p>\n<p>\nPotrivit echipei de cercetare, scorurile mari la testele concepute ini\u0163ial pentru oameni nu indic\u0103 neap\u0103rat o inteligen\u0163\u0103 autentic\u0103. Aceste teste de referin\u0163\u0103 m\u0103soar\u0103 \u00een principal c\u00e2t de bine poate AI s\u0103 \u00eendeplineasc\u0103 sarcini specifice create pentru elevii umani, mai degrab\u0103 dec\u00e2t s\u0103 surprind\u0103 o \u00een\u0163elegere mai profund\u0103.<\/p>\n<p>\n\u00cen ciuda numelui dramatic, Humanity&#8217;s Last Exam nu vrea s\u0103 sugereze c\u0103 oamenii devin \u201edemoda\u0163i\u201d. \u00cen schimb, subliniaz\u0103 cantitatea mare de cuno\u015ftin\u0163e \u015fi expertiz\u0103 care r\u0103m\u00e2ne \u00een continuare specific\u0103 oamenilor.<\/p>\n<p>\nHumanity&#8217;s Last Exam este conceput pentru a servi ca un standard de referin\u0163\u0103 durabil \u015fi transparent pentru viitoarele sisteme de IA.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Pe m\u0103sur\u0103 ce sistemele de inteligen\u0163\u0103 artificial\u0103 (IA) au \u00eenceput s\u0103 ob\u0163in\u0103 scoruri extrem de ridicate la testele academice utilizate de mult timp, cercet\u0103torii au observat o problem\u0103 tot mai mare. Testele care odat\u0103 reprezentau o provocare pentru ma\u015fini nu mai erau suficient de dificile.<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[510],"tags":[25316,6],"class_list":["post-246029","post","type-post","status-publish","format-standard","hentry","category-actualitate","tag-inteligenta-artificiala","tag-test"],"_links":{"self":[{"href":"https:\/\/bm.dev.synology.me\/index.php?rest_route=\/wp\/v2\/posts\/246029","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/bm.dev.synology.me\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/bm.dev.synology.me\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/bm.dev.synology.me\/index.php?rest_route=\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/bm.dev.synology.me\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=246029"}],"version-history":[{"count":0,"href":"https:\/\/bm.dev.synology.me\/index.php?rest_route=\/wp\/v2\/posts\/246029\/revisions"}],"wp:attachment":[{"href":"https:\/\/bm.dev.synology.me\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=246029"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/bm.dev.synology.me\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=246029"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/bm.dev.synology.me\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=246029"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}