La gran biblioteca digital de l’ADN

 

En els seus anys d’institut, a Leroy Hood (Montana, EUA, 1938) el que més li agradava era jugar a futbol americà. Però el seu pare insistia en apuntar contínuament a diferents cursos de teoria electrònica i disseny de circuits. «Així que aleshores jo ja tenia una bona formació en enginyeria», va assegurar Leroy Hood quan va recollir de mans del president Barack Obama la Medalla Nacional de Ciències l’any 2011.

Tot i que en els seus anys universitaris a la Universitat Johns Hopkins (Baltimore) i a l’Institut de Tecnologia de Califòrnia es va centrar en la Biologia, per a ell era gairebé una obsessió aplicar l’enginyeria per revolucionar l’estudi de la vida. I aviat ho va aconseguir. Un dels seus invents desenvolupat durant els seus anys en Caltech, el seqüenciador automàtic d’ADN, va fer possible obtenir cadenes genètiques a gran velocitat i va ser la tecnologia clau per portar a bon port el Projecte Genoma Humà, el primer esborrany va ser anunciat conjuntament pels presidents Bill Clinton (EUA) iTony Blair (Regne Unit) l’any 2000.

Leroy Hood i la furuta biblioteca digital de l'ADN

L’última revolució que Hood albira té a veure amb la salut humana.«Els éssers humans tenen circuits biològics, de la mateixa manera que els té, per exemple, una ràdio», explica aquest visionari. «Per entendre les malalties hem d’entendre abans com aquests circuits arriben a estar danyats per produir la malaltia», assegura. I per a això és necessari estudiar la biologia humana des d’un punt de vista holístic. Fent gala de la seva formació esportiva, Hood explicava fa anys la seva visió amb una metàfora futbolística. «Mai entendràs un partit de futbol definint què va fer el defensa, el defensa o fins i tot el ‘quarterback’. Necessites entendre com juga l’equip com a conjunt i com els altres equips juguen contra ell», va explicar.

Aquesta visió és la que el va portar a albirar un futur en què les consultes mèdiques canviaran completament la seva forma d’abordar un diagnòstic o de receptar un tractament sense saber si és el que més li convé a aquest pacient en concret. És el que va batejar com a medicina P4: predictiva, preventiva, personalitzada i participativa.

«Imagina un futur en el que a un metge li arriba al seu ‘tablet’ un avís de la troballa d’una nova variant genètica d’una malaltia», explica Natalia Jiménez, consultora de Sanitat i Ciències de la Vida de l’empresa de computació Bull. «Aquest doctor va a la base de genomes de pacients seqüenciats i adverteix que hi ha 80 en risc. Per a alguns, per la seva edat o el seu historial mèdic familiar, n’hi haurà prou amb enviar-los una advertència amb consells sobre l’estil de vida saludable que els convé seguir. Però als que estan en risc real immediat, els citarà a la consulta per començar un protocol de seguiment. Aquest és el futur pel qual estem treballant», assegura.

Els experts asseguren que encara queda molt per avançar en passos previs, però les modernes tècniques de seqüenciació de la mà amb la supercomputació ja estan treballant en aquesta direcció. L’objectiu és crear una enorme biblioteca digital de dades mèdiques que permeti creuar la història clínica del pacient amb la seva informació genètica personal, l’historial mèdic de la seva família i qualsevol altra informació que pugui ser rellevant a l’hora de fer un diagnòstic, com si es té una feina de risc o l’entorn ambiental en què viu l’individu.

La batalla s’està lliurant a les entranyes dels grans centres de seqüenciació genòmica i entre els algoritmes matemàtics que impulsen els superordinadors i els nous sistemes d’emmagatzematge de la informació digital. «Hi ha qui diu que és un repte més gran que posar un home a la Lluna», diu a El Mundo Yvo Gut, director del Centre Nacional d’Anàlisi Genòmica (CNAG), assegut al seu despatx del Parc Científic de Barcelona. «I és cert que és una tasca gegantina. Potser és el més gran repte al que ens enfrontem en l’actualitat. L’LHC de Ginebra és una cosa senzilla comparat amb això. És una qüestió de diners, però també d’enginyeria, d’ètica, d’informàtica, de ciència, fins i tot un tema social», assegura.

Però tot i això, hi ha símptomes que permeten pensar que és possible.La seqüenciació ha avançat tan de pressa en menys de dues dècades que una tasca com obtenir la cadena d’ADN completa d’un ésser humà, que va costar prop de 3.000 milions d’euros i va portar 10 anys, es pot obtenir avui en dia en dues hores per uns 5.000 euros. És obvi que no és la mateixa tasca. Ara hi ha un genoma de referència amb el qual comparar cada cas determinat, però la comparació dóna idea de la velocitat d’avanç d’aquest camp de recerca.

Cada un de nosaltres tenim milions de milions de cèl·lules en el nostre cos i dins de cadascuna d’elles hi ha una còpia del genoma complet. Aquesta seqüència particular de cada individu està feta de 3.000 milions de maons, que corresponen a les quatre lletres del codi genètic C, G, T i A (les bases nitrogenades de l’ADN: citosina, guanina, timina i adenina). I l’important és l’ordre que aquests maons adopten en la cadena, això és el que condiciona el contingut dels gens.

Dins del nucli de la cèl·lula, la informació genètica està organitzada en cromosomes, com llibres d’una biblioteca. «No podem començar en un extrem del cromosoma i llegir la informació correctament. Hem de trossejar aleatòriament la molècula d’ADN fins una mida que puguem llegir, unes 100 bases per cada fragment», explica Gut. I cada cromosoma conté centenars de milions de parells de bases.«És com si tinguéssim un llibre i només poguéssim llegir una frase cada vegada», diu.

Per això, per desxifrar un genoma complet, els investigadors prenen fins a milions de cèl·lules a les que extreuen l’ADN i ho fan trossets.«Com fem el mateix amb moltes cèl·lules i no totes es tallen pel mateix lloc, podem enfrontar amb el genoma de referència i anar solapant frases fins a construir la veritable història. I aquí és on entra la supercomputació. Tenim un gran argument de 3.000 milions de lletres que trossegem a la babalà en trossos de 100. I després hem de ajuntar les peces del puzle per reconstruir la història de manera que tingui sentit», aclareix Yvo Gut.

«La gent de supercomputació fa broma amb nosaltres perquè diuen que no fem supercomputació, que només calculem molt … Sí! Hem de fer molts càlculs, per això necessitem la supercomputació», riu Gut. Precisament, el CNAG acaba d’ampliar, amb tecnologia de l’empresa Bull, la seva capacitat informàtica per fer front als nous reptes als quals s’enfronta, i ja compta amb 2,7 petabytes d’emmagatzematge de dades -2.700.000 de gigues– i més de 1200 nuclis de computació, el ​​que col·loca al centre espanyol en el segon lloc europeu,després del Sanger del Regne Unit. «Funcionant al complet en un sol genoma pot realitzar l’anàlisi completa en dues hores. Tenim capacitat per produir 8 genomes cada 24 hores», diu Gut. «Un genoma complet ocupa des 100-300 gigabytes, però ens quedem amb la informació més rellevant i vam aconseguir reduir-lo a 300 megues», explica Sergi Beltran, líder del grup d’Anàlisi Bioinformàtic del CNAG.

Ara fa poc més d’un any, el president David Cameron anunciava l’aprovació d’un pressupost de 100 milions de lliures (uns 125 milions d’euros) per seqüenciar 100.000 genomes de pacients del Regne Unit. Es tractava del primer acostament del món a escala nacional al somni que s’albira Leroy Hood des de fa dècades.

«Només pel fet de seqüenciar 100.000 genomes ja estem fent que el preu baixi. Els seqüenciadors estaran treballant sense descans i això ajuda que el preu baixi», explica a aquest diari Vivienne Parry, veterana periodista de la BBC i actual portaveu de l’agència Genomics England creada pel Govern britànic per dur a terme el projecte anomenat UK 100K .

«Quan acabi aquesta iniciativa, el 2017, haurem construït els fonaments per posar en marxa un sistema nacional que faci anàlisi genòmics com a rutina per a tots els pacients del Regne Unit. Això començarà el 2018 i per llavors hi haurà ia centres de medicina genòmica a tot el país i la seqüenciació de genomes sencers serà barata i fiable», assegura Parry.

Al Regne Unit tothom tindrà un número únic d’identificació genètica i es podrà creuar amb la història clínica des que va néixer el pacient, fins les últimes malaltia comuna per la qual va anar al metge, passant per aquella operació d’apendicitis. I quan es mori aquesta informació es mantindrà en el Sistema Nacional de Salut.

L’objectiu és que serveixi per fer treballs de recerca. Però el fet que la informació personal estigui disponible per a la consulta ha fet necessària la inclusió d’un comitè d’ètica. «Es pot pensar en aquest sistema com en una biblioteca, però en lloc que puguis emportar-te un llibre a casa, només pots mirar a la biblioteca», aclareix Parry.«Com un incunable d’una gran Biblioteca Nacional, pots mirar si ets un investigador que ha obtingut permís per estudiar-lo, però no t’ho pots emportar a casa i estaràs monitoritzat en tot moment perquè no hi hagi males pràctiques», diu. L’accés a les dades per part d’un científic o d’una companyia implicarà l’acceptació d’estrictes controls ètics i de seguretat.

«No sé si serà d’aquí a 10 o 15 anys o si serà en cinc, però en el futur tindrem tota aquesta informació emmagatzemada en el mateix lloc per poder avaluar ràpidament un determinat cas i saber com actuar», opina Yvo Gut.

 

Font: Enginyers en informàtica de Catalunya