{"id":681578,"date":"2026-03-13T06:56:03","date_gmt":"2026-03-13T06:56:03","guid":{"rendered":"https:\/\/microscopemedia.com\/?p=681578"},"modified":"2026-03-13T06:56:03","modified_gmt":"2026-03-13T06:56:03","slug":"ultimul-examen-al-umanitatii-cel-mai-dificil-test-de-inteligenta-artificiala-creat-de-cercetatori-din-istorie-rezultatele-sunt-surprinzatoare","status":"publish","type":"post","link":"https:\/\/microscopemedia.com\/?p=681578","title":{"rendered":"\u201eUltimul examen al umanit\u0103\u021bii\u201d, cel mai dificil test de inteligen\u021b\u0103 artificial\u0103 creat de cercet\u0103tori din istorie. Rezultatele sunt surprinz\u0103toare"},"content":{"rendered":"<div><img decoding=\"async\" src=\"https:\/\/microscopemedia.com\/wp-content\/uploads\/2026\/03\/ultimul-examen-al-umanitatii-cel-mai-dificil-test-de-inteligenta-artificiala-creat-de-cercetatori-din-istorie-rezultatele-sunt-surprinzatoare.jpg\" class=\"ff-og-image-inserted\"><\/div>\n<p id=\"p-0\">Evalu\u0103ri bine cunoscute, precum examenul Massive Multitask Language Understanding (MMLU), care anterior era considerat exigent, nu mai reu\u0219esc s\u0103 m\u0103soare \u00een mod adecvat capacit\u0103\u021bile modelelor avansate de IA din prezent, potrivit ScienceDaily.<\/p>\n<p id=\"p-1\">Pentru a rezolva aceast\u0103 problem\u0103, un grup interna\u021bional format din aproape 1.000 de cercet\u0103tori a dezvoltat un nou tip de test. Obiectivul lor era s\u0103 creeze un examen cuprinz\u0103tor, dificil \u0219i bazat pe cuno\u0219tin\u021bele umane specializate, pe care sistemele actuale de IA \u00eenc\u0103 nu le pot gestiona.<\/p>\n<p id=\"p-2\">Rezultatul este \u201eHumanity\u2019s Last Exam\u201d (n.r \u2013 \u201eUltimul examen al umanit\u0103\u021bii\u201d), o evaluare cu 2.500 de \u00eentreb\u0103ri care acoper\u0103 matematica, \u0219tiin\u021bele umaniste, \u0219tiin\u021bele naturale, limbile antice \u0219i o gam\u0103 larg\u0103 de domenii academice foarte specializate.<\/p>\n<p id=\"p-3\">Scopul examenului nu a fost acela de a p\u0103c\u0103li sau de a \u00eenvinge participan\u021bii umani. \u00cen schimb, obiectivul a fost acela de a identifica cu aten\u021bie domeniile \u00een care sistemele de IA \u00eenc\u0103 sunt deficitare.<\/p>\n<p id=\"p-4\">Speciali\u0219ti din \u00eentreaga lume au redactat \u0219i revizuit \u00eentreb\u0103rile incluse \u00een Humanity\u2019s Last Exam. Fiecare problem\u0103 a fost conceput\u0103 cu aten\u021bie, astfel \u00eenc\u00e2t s\u0103 aib\u0103 un r\u0103spuns clar \u0219i verificabil. \u00centreb\u0103rile au fost elaborate pentru a \u00eempiedica g\u0103sirea de solu\u021bii rapide prin simple c\u0103ut\u0103ri pe internet.<\/p>\n<p id=\"p-5\">Subiectele provin din provoc\u0103ri academice avansate. Unele sarcini implic\u0103 traducerea inscrip\u021biilor antice din Palmyra, \u00een timp ce altele necesit\u0103 identificarea structurilor anatomice minuscule ale p\u0103s\u0103rilor sau analizarea caracteristicilor detaliate ale pronun\u021biei ebraice biblice.<\/p>\n<p id=\"p-6\">Cercet\u0103torii au testat fiecare \u00eentrebare cu ajutorul sistemelor de IA de v\u00e2rf. Dac\u0103 un model era capabil s\u0103 r\u0103spund\u0103 corect la o \u00eentrebare, acea \u00eentrebare era eliminat\u0103 din examenul final. Acest proces a asigurat c\u0103 testul a r\u0103mas pu\u021bin peste ceea ce sistemele actuale de IA pot rezolva \u00een mod fiabil.<\/p>\n<p id=\"p-7\">Testele ini\u021biale au confirmat c\u0103 strategia a func\u021bionat. Chiar \u0219i modelele puternice de IA au avut dificult\u0103\u021bi cu examenul. GPT-4o a ob\u021binut un scor de 2,7%, \u00een timp ce Claude 3.5 Sonnet a atins 4,1%. Modelul o1 al OpenAI a avut o performan\u021b\u0103 ceva mai bun\u0103, cu 8%. Cele mai performante sisteme de p\u00e2n\u0103 acum, inclusiv Gemini 3.1 Pro \u0219i Claude Opus 4.6, au atins niveluri de precizie \u00eentre aproximativ 40% \u0219i 50%.<\/p>\n<p id=\"p-8\">Potrivit echipei de cercetare, scorurile mari la testele concepute ini\u021bial pentru oameni nu indic\u0103 neap\u0103rat o inteligen\u021b\u0103 autentic\u0103. Aceste teste de referin\u021b\u0103 m\u0103soar\u0103 \u00een principal c\u00e2t de bine poate AI s\u0103 \u00eendeplineasc\u0103 sarcini specifice create pentru elevii umani, mai degrab\u0103 dec\u00e2t s\u0103 surprind\u0103 o \u00een\u021belegere mai profund\u0103.<\/p>\n<h2 id=\"chapter-0\">Nu o amenin\u021bare, ci un instrument<\/h2>\n<p id=\"p-9\">\u00cen ciuda numelui dramatic, Humanity\u2019s Last Exam nu vrea s\u0103 sugereze c\u0103 oamenii devin \u201edemoda\u021bi\u201d. \u00cen schimb, subliniaz\u0103 cantitatea mare de cuno\u0219tin\u021be \u0219i expertiz\u0103 care r\u0103m\u00e2ne \u00een continuare specific\u0103 oamenilor.<\/p>\n<p id=\"p-10\">Humanity\u2019s Last Exam este conceput pentru a servi ca un standard de referin\u021b\u0103 durabil \u0219i transparent pentru viitoarele sisteme de IA.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Evalu\u0103ri bine cunoscute, precum examenul Massive Multitask Language Understanding (MMLU), care anterior era considerat exigent, nu mai reu\u0219esc s\u0103 m\u0103soare \u00een mod adecvat capacit\u0103\u021bile modelelor avansate de IA din prezent, &hellip; <a href=\"https:\/\/microscopemedia.com\/?p=681578\" class=\"more-link\">Read More<\/a><\/p>\n","protected":false},"author":1,"featured_media":681579,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"Default","format":"standard","meta":[],"categories":[1],"tags":[],"_links":{"self":[{"href":"https:\/\/microscopemedia.com\/index.php?rest_route=\/wp\/v2\/posts\/681578"}],"collection":[{"href":"https:\/\/microscopemedia.com\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/microscopemedia.com\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/microscopemedia.com\/index.php?rest_route=\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/microscopemedia.com\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=681578"}],"version-history":[{"count":0,"href":"https:\/\/microscopemedia.com\/index.php?rest_route=\/wp\/v2\/posts\/681578\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/microscopemedia.com\/index.php?rest_route=\/wp\/v2\/media\/681579"}],"wp:attachment":[{"href":"https:\/\/microscopemedia.com\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=681578"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/microscopemedia.com\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=681578"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/microscopemedia.com\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=681578"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}