La douăzeci și doi de ani după finalizarea Proiectului Genomului Uman, oamenii de știință au dezvăluit cel mai amplu catalog de variații genetice umane compilat vreodată.
În două noi articole publicate miercuri (23 iulie) în revista Nature, oamenii de știință au secvențiat ADN-ul a 1.084 de persoane din întreaga lume. Ei au folosit progresele tehnologice recente pentru a analiza fragmente lungi de material genetic de la fiecare persoană, au asamblat aceste fragmente și au comparat genomul rezultat în detaliu, potrivit Live Science.
Rezultatele aprofundează înțelegerea noastră asupra „variantelor structurale” din genomul uman. În loc să afecteze o singură „literă” din codul ADN-ului, aceste variații afectează porțiuni mari din cod — ele pot fi șterse din genom sau adăugate la acesta, sau pot cuprinde locuri în care ADN-ul a fost inversat sau mutat într-o altă locație.
„Acum 20 de ani, consideram aceste secvențe ca fiind gunoi ADN”
Studiile au dezvăluit caracteristici „ascunse” ale genomului uman care anterior erau prea dificil de studiat din punct de vedere tehnologic, a declarat Jan Korbel, directorul interimar al Laboratorului European de Biologie Moleculară (EMBL) din Heidelberg, care este coautor al ambelor articole noi. De exemplu, porțiuni mari ale genomului conțin coduri care se repetă la nesfârșit și care erau considerate nefuncționale.
„Acum aproximativ 20 de ani, consideram aceste secvențe ca fiind „ADN gunoi” (n.r. junk DNA) – le-am dat un termen foarte negativ”, a declarat Korbel pentru Live Science. „Se realizează din ce în ce mai mult că aceste secvențe nu sunt gunoi”, iar noua lucrare aruncă lumină asupra acestor secvențe de ADN mult timp denigrate.
În plus, toate datele generate în noile studii sunt accesibile publicului, astfel încât alți cercetători din domeniu pot acum să utilizeze „descoperirile și unele dintre instrumentele pe care le-am dezvoltat în scopul lor de a înțelege baza genetică a bolilor”, a declarat Korbel pentru Live Science. „Sunt convinsă că progresele pe care le publicăm astăzi în Nature vor fi utilizate, în parte, și în diagnosticare.”
Peste 1.000 de genomuri
Când a fost publicată prima versiune a genomului uman „complet” în 2003, aceasta omitea de fapt aproximativ 15% din secvența sa din cauza limitărilor tehnologice ale vremii. În 2013, oamenii de știință au reușit să reducă această lacună cu aproximativ jumătate. Și, în cele din urmă, în 2022, a fost publicat primul genom uman „fără lacune”.
În 2023, cercetătorii au publicat prima versiune a pangenomului uman, care a incorporat ADN-ul a 47 de persoane din întreaga lume, în loc să se bazeze în principal pe ADN-ul unei singure persoane. În același an, cercetătorii au publicat primul cromozom Y care a fost secvențiat de la un capăt la altul, deoarece genomul „fără lacune” anterior încă nu includea cromozomul sexual masculin.
În ultimii ani, domeniul a continuat să avanseze, datorită noilor tehnologii și eforturilor de extindere a eșantionării ADN-ului dincolo de populațiile de origine preponderent europeană. Aceste progrese au precedat cele două articole publicate în Nature săptămâna aceasta.
În primul studiu, cercetătorii au secvențiat ADN-ul a 1.019 persoane reprezentând 26 de populații de pe cinci continente. Pentru a analiza ADN-ul, cercetătorii au colectat „citiri lungi”, fiecare compusă din zeci de mii de perechi de baze; o pereche de baze corespunde cu o treaptă în scara spirală a unei molecule de ADN.
Ce sunt „genele săritoare”
„Cu citiri scurte de aproximativ 100 de perechi de baze, este dificil să se facă distincția între regiunile genomice care arată similar”, a explicat coautorul studiului, Jesus Emiliano Sotelo-Fonseca, doctorand la Centrul pentru Reglementare Genomică (CGR) din Barcelona, Spania. Acest lucru este valabil în special în regiunile repetitive ale genomului. „Cu citiri mai lungi, de aproximativ 20.000 de perechi de baze, atribuirea fiecărei citiri unei poziții unice în genom devine mult mai ușoară”, a declarat el pentru Live Science într-un e-mail.
Mai mult de jumătate din noile variații genomice descoperite în cadrul studiului au fost găsite în acele regiuni repetitive dificile, inclusiv în transpozoni, cunoscuți și sub numele de „gene săritoare”. Transpozonii pot sări în diferite locații din genom, copiind și lipind codul lor. Uneori, în funcție de locul în care aterizează, pot destabiliza genomul, introduce mutații dăunătoare și contribui la apariția unor boli precum cancerul.
„Poate părea o diferență mică, dar este de fapt enormă”
Al doilea studiu a inclus un număr mult mai mic de genomuri – doar 65 în total –, dar a secvențiat genomurile într-un mod mai cuprinzător decât primul studiu. Primul studiu a capturat aproximativ 95% din fiecare genom analizat, în timp ce al doilea studiu a generat genomuri complete în proporție de 99%.
„Poate părea o diferență mică, dar este de fapt enormă din perspectiva unui cercetător în genomică”, a spus Korbel. „Obținerea ultimelor câteva procente este o realizare majoră.”
Acest salt a necesitat tehnici de secvențiere diferite, precum și noi abordări analitice. „Acest proiect a utilizat software de ultimă generație pentru a asambla genomurile și a identifica variațiile genetice, multe dintre acestea neexistând pur și simplu acum câțiva ani”, a declarat coautorul Charles Lee, profesor la Jackson Laboratory for Genomic Medicine, într-un e-mail adresat Live Science.
Tehnicile de secvențiere au inclus una care a generat citiri lungi cu foarte puține erori și una care a generat citiri ultra-lungi, care erau puțin mai predispuse la erori. Cu prețul analizării unui număr mai mic de genomi, această abordare a permis totuși celui de-al doilea studiu să captureze segmente de ADN care au fost complet omise în primul studiu, a spus Rodríguez-Martín.
Problemele legate de divizarea cromozomilor pot duce la diverse afecțiuni, cum ar fi Sindromul Down
Aceste regiuni „ascunse” includeau centromerii, structuri importante situate în centrul cromozomilor, care sunt esențiale pentru diviziunea celulară. În momentul în care o celulă se pregătește să se dividă, fibrele se atașează de centromeri și apoi trag cromozomul în două. Studiul a descoperit că, în aproximativ 7% din centromeri, există probabil două locuri în care aceste fibre se pot atașa, în loc de unul singur.
„Ar putea asta să însemne că acei cromozomi sunt mai instabili? Pentru că, dacă fusul se atașează de două puncte, ar putea crea confuzie”, a spus Korbel. Aceasta este o idee pur speculativă, a adăugat el, dar este una care poate fi explorată acum. Următorul pas va fi studierea efectelor acestor variații ale centromerilor în mod experimental, a fost de acord Lee.
Problemele legate de divizarea cromozomilor pot duce la diverse afecțiuni. De exemplu, „sindromul Down este rezultatul unei erori de segregare cromozomială în timpul diviziunii celulare în meioză”, când celulele se divid pentru a forma spermatozoizi și ovule, a declarat într-un e-mail pentru Live Science coautoarea studiului, dr. Miriam Konkel, profesor asistent la Centrul de Genetică Umană al Universității Clemson.
La fel ca primul studiu, și al doilea studiu a oferit o perspectivă fără precedent asupra genelor săritoare, catalogând peste 12.900. Dincolo de cancer, genele săritoare pot declanșa și diverse boli genetice prin provocarea de mutații, precum și schimbări mai subtile în modul în care genele sunt activate și dezactivate, a remarcat Konkel. O mai bună înțelegere a diversității genelor săritoare poate ajuta la descifrarea funcției lor în sănătatea și bolile umane.
„Cu câțiva ani în urmă, asamblarea unui cromozom uman complet de la un capăt la altul, era imposibilă”
Analizând ambele studii, oamenii de știință pot compara acum genomurile recent secvențiate cu alte seturi de date care includ atât date genomice, cât și date privind sănătatea, a remarcat Korbel. Acesta ar fi primul pas către corelarea variațiilor structurale recent descoperite cu rezultate tangibile în materie de sănătate și, în cele din urmă, către incorporarea acestor cunoștințe în practica medicală.
„Anumite studii clinice nu vor putea ignora aceste tehnici de secvențiere, deoarece ele le vor oferi o sensibilitate mai mare pentru identificarea variațiilor”, a spus Korbel. „Nu vrei să pierzi variante.”
Mai sunt încă multe de făcut pentru a îmbunătăți datele genomice, a adăugat Lee. S-ar putea încorpora mai mult ADN din populații subreprezentate, iar tehnicile și software-ul de secvențiere ar putea fi perfecționate pentru a face procesul mai eficient și mai precis. Însă, între timp, cele două studii noi reprezintă o realizare tehnologică majoră.
„Aceste instrumente avansate au fost dezvoltate recent pentru a gestiona cantitățile uriașe de date de citire lungă pe care le folosim acum pentru fiecare genom”, a spus Lee. „Cu câțiva ani în urmă, asamblarea unui cromozom uman complet de la un capăt la altul, în special incluzând centromerii, era practic imposibilă, deoarece software-ul și algoritmii nu erau încă maturi.”