Antena 3 CNN Life Știinţă Descoperire neșteptată: Și inteligența artificială „îmbătrânește”. Un studiu demonstrează declinul cognitiv la modele de AI mai vechi

Descoperire neșteptată: Și inteligența artificială „îmbătrânește”. Un studiu demonstrează declinul cognitiv la modele de AI mai vechi

Mia Lungu
2 minute de citit Publicat la 17:03 17 Feb 2025 Modificat la 17:03 17 Feb 2025
creier inteligenta artificiala roboti
Modelele AI mai vechi prezintă semne de deteriorare a capacităților cognitive odată cu înaintarea în vârstă. Imagine cu caracter ilustrativ. Sursa foto: Getty Images

Oamenii se bazează din ce în ce mai mult pe inteligența artificială (AI) pentru diagnosticele medicale datorită rapidității și eficienței cu care aceste instrumente pot detecta anomalii și semne de avertizare în istoricul medical, radiografii și alte seturi de date înainte ca acestea să devină evidente cu ochiul liber. Dar un nou studiu publicat la 20 decembrie 2024 ridică îngrijorări cu privire la faptul că tehnologiile AI, cum ar fi modelele lingvistice mari (LLM) și chatboții, la fel ca oamenii, prezintă semne de deteriorare a capacităților cognitive odată cu înaintarea în vârstă, potrivit Live Science.

„Aceste constatări pun la îndoială ipoteza că inteligența artificială va înlocui în curând medicii umani”, au scris autorii studiului în lucrare, „deoarece deteriorarea cognitivă evidentă la chatbot-urile de vârf poate afecta fiabilitatea lor în diagnosticarea medicală și poate submina încrederea pacienților”.

Oamenii de știință au testat chatbot-urile bazate pe LLM disponibile public, inclusiv ChatGPT de la OpenAI, Sonnet de la Anthropic și Gemini de la Alphabet, utilizând testul de evaluare cognitivă de la Montreal (MoCA) - o serie de sarcini pe care neurologii le utilizează pentru a testa abilitățile de atenție, memorie, limbaj, abilități spațiale și funcții mentale executive.

Ce este testul MoCA

MoCA este cel mai frecvent utilizat pentru a evalua sau testa debutul afectării cognitive în afecțiuni precum boala Alzheimer sau demența. Subiecților li se atribuie sarcini precum desenarea unei ore specifice pe cadranul unui ceas, începerea de la 100 și scăderea repetată a șapte, memorarea a cât mai multe cuvinte dintr-o listă vorbită și așa mai departe. La om, 26 din 30 este considerat un scor de trecere (adică subiectul nu are nicio afectare cognitivă.

În timp ce unele aspecte ale testării, cum ar fi numirea, atenția, limbajul și abstractizarea, au fost aparent ușoare pentru majoritatea LLM-urilor utilizate, toate acestea au avut rezultate slabe în ceea ce privește abilitățile vizuale/spațiale și sarcinile executive, câteva dintre ele având rezultate mai slabe decât altele în domenii precum reamintirea întârziată.

În mod crucial, în timp ce cea mai recentă versiune a ChatGPT (versiunea 4) a obținut cel mai mare punctaj (26 din 30), LLM Gemini 1.0 mai vechi a obținut doar 16 - ceea ce conduce la concluzia că LLM mai vechi prezintă semne de declin cognitiv.

„O zonă semnificativă de slăbiciune”

Autorii studiului notează că rezultatele lor sunt doar observaționale - diferențele critice dintre modul în care funcționează inteligența artificială și mintea umană înseamnă că experimentul nu poate constitui o comparație directă. Dar ei avertizează că ar putea indica ceea ce ei numesc o „zonă semnificativă de slăbiciune” care ar putea pune frână implementării IA în medicina clinică. În special, ei au argumentat împotriva utilizării AI în sarcini care necesită abstractizare vizuală și funcție executivă.

De asemenea, se ridică noțiunea oarecum amuzantă de neurologi umani care se ocupă de o piață cu totul nouă - AI-urile însele care prezintă semne de insuficiență cognitivă.

×
x close