AlphaGenome, noul instrument de inteligență artificială al grupului Google, prezentat public miercuri, reprezintă un progres important în interpretarea genomului. Sistemul analizează modul în care anumite porțiuni din ADN reglează activitatea genelor în interiorul celulelor, relatează AFP, citată de Agerpres.
Secvențierea completă a genomului uman, realizată în 2003, „ne-a oferit cartea vieții, dar citirea ei rămâne o provocare”, a declarat Pushmeet Kohli, vicepreședinte al diviziei de cercetare Google DeepMind, cu prilejul prezentării AlphaGenome, într-un studiu publicat în revista Nature.
„Avem textul” – succesiunea de aproximativ 3 miliarde de perechi de nucleotide A, T, C și G care formează ADN-ul – însă „înțelegerea gramaticii (…) și maniera în care ea guvernează viața reprezintă următoarea frontieră majoră a cercetării”, a subliniat el în fața presei.
Aproximativ 2% din ADN-ul uman codifică direct proteinele, esențiale pentru funcționarea organismelor vii. Restul de 98% are un rol de coordonare și reglare a expresiei genetice în fiecare celulă. Aceste secvențe, denumite „necodante”, conțin numeroase variații asociate cu diferite boli.
AlphaGenome se concentrează tocmai asupra acestor secvențe necodante și completează celelalte modele dezvoltate de laboratorul de inteligență artificială al Google: AlphaMissense, care analizează secvențele codante ale ADN-ului, AlphaProteo, dedicat sintezei proteinelor, și AlphaFold, modelul de predicție a structurii proteinelor recompensat cu Premiul Nobel pentru Chimie în 2024.
Modelul de învățare profundă a fost antrenat cu date provenite din mari consorții publice, care au măsurat experimental aceste mecanisme în sute de tipuri de celule și țesuturi prelevate de la oameni și șoareci.
AlphaGenome poate analiza secvențe foarte lungi de ADN și poate „prezice” influența fiecărei perechi de nucleotide asupra mai multor procese biologice, precum activarea sau inhibarea expresiei genelor ori controlul proceselor de asamblare a ARN-ului.
Un instrument fundamental, dar cu limite
Alte modele similare există deja, însă acestea trebuie să aleagă între lungimea secvențelor analizate și precizia rezultatelor. O secvență lungă, de până la un milion de perechi de nucleotide, este „necesară pentru a înțelege mediul regulator complet al unei gene unice”, a explicat Ziga Avsec, coautor al proiectului. Rezoluția ridicată permite compararea efectelor variantelor genetice prin raportare la secvențele nemodificate.
Un alt avantaj al AlphaGenome constă în faptul că poate modela simultan influența ADN-ului asupra a 11 procese biologice, în timp ce până acum cercetătorii erau nevoiți să utilizeze mai multe modele separate.
„Acest instrument poate accelera înțelegerea noastră asupra genomului, ajutând la cartografierea localizării unor elemente funcționale și la determinarea rolului lor la nivel molecular”, a declarat Natasha Latysheva, coautoare a studiului.
„Sperăm că cercetătorii vor îmbogăți acest model cu mai multe date și noi abordări”, a adăugat Pushmeet Kohli. AlphaGenome a fost deja testat de aproximativ 3.000 de oameni de știință din 160 de țări și este disponibil în regim open-source pentru cercetare non-comercială.
„Identificarea cu precizie a diferențelor dintre genomurile noastre, care ne fac mai mult sau mai puțin susceptibili la mii de boli, reprezintă o etapă-cheie către tratamente mai bune”, a declarat Ben Lehner, directorul departamentului de genomică generativă și sintetică de la Institutul Wellcome Sanger din Cambridge.
Cercetătorul, care nu a participat direct la proiect, consideră că AlphaGenome este „foarte performant”, dar încă „departe de a fi perfect”.
„Modelele AI nu sunt bune decât în măsura în care datele utilizate pentru antrenarea lor sunt bune”, a avertizat el, subliniind că majoritatea seturilor de date existente „sunt prea mici și insuficient standardizate”, potrivit unui comunicat al Science Media Center.
AlphaGenome nu reprezintă „o soluție miraculoasă la toate întrebările din biologie”, deoarece expresia genelor este influențată de factori de mediu complecși, însă rămâne „un instrument fundamental”, a declarat Robert Goldstone, directorul diviziei de genomică de la Institutul Francis Crick, citat în același comunicat. În opinia sa, noul model va permite cercetătorilor „să studieze și să simuleze, într-un mod programatic, bazele genetice ale unor boli complexe”.