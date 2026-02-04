Dezvăluiri din Proiectul Panama: Milioane de cărți au fost scanate și distruse de Anthropic AI pentru a antrena inteligența artificială

Milioane de cărți au fost scanate și distruse de Anthropic pentru a antrena AI. Imagine cu caracter ilustrativ. Sursa foto: Getty Images

Timp de secole, cea mai de încredere și durabilă formă de informație a fost cartea. Cărțile documentează lunga evoluție a umanității, de la unelte primitive și supraviețuire la rachete care ajung pe Marte, de la scrisori de mână la rețele digitale, de la culesul hranei la comandarea cinei în câteva minute. Ele păstrează ideile peste generații. În interiorul Anthropic, planificatorii au privit cărțile ca pe o formă concentrată de cunoaștere umană, modelată de editori, autori și timp. Ei credeau că textele de lungă durată pot învăța inteligența artificială să raționeze și să scrie mai clar decât conținutul fragmentat de pe internet, potrivit The Times of India.

Această convingere a dus la un efort intern care avea să fie cunoscut ulterior drept Proiectul Panama. Documente judiciare desecretizate într-un proces pentru încălcarea drepturilor de autor arată cum a funcționat.

Anthropic, startup-ul din San Francisco care a creat chatbot-ul Claude și popularul Claude Code, a cumpărat cărți fizice în cantități mari. Volumele au fost desfăcute și scanate la viteză mare. Odată digitalizate, exemplarele pe hârtie au fost reciclate. Scopul a fost extinderea rapidă a cantității de date bazate pe cărți folosite pentru antrenarea sistemelor AI ale companiei.

Amploarea proiectului a devenit publică după un reportaj al The Washington Post, care a oferit o privire rară asupra modului agresiv în care firmele de inteligență artificială au urmărit texte de înaltă calitate, pe fondul intensificării competiției pentru construirea unor chatboți mai performanți.

Documente interne arată că firma a ales această abordare în locul negocierii unor licențe la scară largă. Directorii au susținut că achiziționarea de cărți fizice și digitizarea lor internă era mai rapidă și mai practică. Strategia reflecta și cursa tot mai dură pentru dominația în domeniul inteligenței artificiale, unde fiecare progres se poate traduce direct în cotă de piață, investiții și venituri.

Într-o industrie care avansează într-un ritm amețitor, cu noutăți aproape zilnice, accesul la date de înaltă calitate a devenit unul dintre cele mai valoroase active în transformarea capabilităților AI în putere comercială.

Cum a procesat Proiectul Panama milioane de cărți

Propunerile furnizorilor și documentele instanței indică faptul că Anthropic a urmărit o capacitate de scanare între 500.000 și 2 milioane de cărți, pe parcursul a aproximativ șase luni. Deși numărul final exact rămâne cenzurat, dosarele descriu în mod repetat achiziția și distrugerea a milioane de volume, cumpărate în loturi de zeci de mii. Proiectul a implicat cheltuieli de zeci de milioane de dolari pentru cărți, logistică și servicii de scanare, subliniind cât de centrale deveniseră cărțile în strategiile de antrenare a inteligenței artificiale.

După achiziție, cărțile erau trimise către furnizori comerciali specializați în procesarea industrială a documentelor. Mașini hidraulice tăiau cotoarele, permițând scanarea paginilor pe echipamente de mare viteză. După digitizare, exemplarele pe hârtie erau programate pentru reciclare. Procesul era intenționat ireversibil, fără a lăsa în urmă o arhivă fizică.

Specialiștii în conservare notează că acest lucru diferențiază Proiectul Panama de inițiativele anterioare de digitizare, care păstrau de regulă copiile originale.

Documentele instanței sugerează că Anthropic a considerat scanarea distructivă o alternativă mai sigură decât descărcarea unor biblioteci digitale piratate de mari dimensiuni. Abordarea s-a bazat pe lecțiile învățate din eforturi anterioare de digitizare în masă, inclusiv Google Books, și a fost influențată parțial de Tom Turvey, care lucrase anterior la acel proiect. Spre deosebire de Google Books însă, Proiectul Panama a prioritizat viteza și exclusivitatea în detrimentul accesului public sau al conservării.

Un judecător federal a decis ulterior că antrenarea modelelor AI pe baza cărților poate fi considerată utilizare echitabilă (fair use) atunci când procesul este transformator. Totuși, instanța a stabilit și că descărcările anterioare de cărți piratate de către Anthropic ridică probleme separate de drepturi de autor, subliniind că modul în care sunt obținute datele de antrenament rămâne relevant din punct de vedere legal, chiar dacă antrenarea în sine este permisă.

Reacția autorilor și acordul de despăgubire

Autorii au reacționat vehement la dezvăluiri, susținând că firmele de inteligență artificială au beneficiat de munca creativă fără consimțământ sau compensație. Ed Newton-Rex, fost director în industria AI, a declarat că acest caz ilustrează un dezechilibru tot mai mare între companiile tehnologice și creatorii ale căror lucrări stau la baza sistemelor moderne de inteligență artificială. El și alții au argumentat că actualele cadre de drepturi de autor nu abordează adecvat învățarea automată la scară largă.

În 2025, Anthropic a fost de acord să plătească 1,5 miliarde de dolari pentru a soluționa cererile legate de utilizarea anterioară a cărților piratate, fără a admite vreo vină. Conform acordului, autorii ale căror lucrări au fost incluse pot solicita compensații estimate la aproximativ 3.000 de dolari per titlu, deși sumele variază. Anthropic a precizat că înțelegerea vizează practicile de achiziție a datelor, nu legalitatea antrenării inteligenței artificiale în sine.

Parte a unui tipar mai larg în industrie

Proiectul Panama nu este un caz izolat. Documente judiciare din alte procese arată că angajați ai Meta au discutat despre descărcarea unor biblioteci „din umbră” de mari dimensiuni, în timp ce OpenAI a recunoscut că a descărcat seturi similare de date în trecut, înainte de a le șterge. Google și Microsoft se confruntă, de asemenea, cu procese în curs legate de datele folosite pentru antrenarea AI.

Juristul James Grimmelmann a afirmat că industria a transferat normele academice privind utilizarea datelor într-o cursă comercială a înarmării tehnologice, confruntându-se cu riscurile legale abia după ce investiții masive fuseseră deja făcute. La acel moment, a observat el, companiile erau practic blocate în fluxuri de date dificil de desființat.

Documentele desecretizate din jurul Proiectului Panama oferă una dintre cele mai clare imagini de până acum asupra modului în care sunt construite sistemele moderne de inteligență artificială. Ele arată că, în spatele chatboților destinați publicului larg, există o infrastructură industrială care implică cheltuieli masive de capital, riscuri juridice și extracție ireversibilă de date.

Cazul a intensificat și dezbaterea privind capacitatea actualei legislații a drepturilor de autor de a face față învățării automate la scară largă.