NOTÍCIES
25 years since the publication of the human genome in Science: a firsthand perspective
Media coverage in the newspaper El País marking Roderic and Pep's achievement
Twenty five years ago, humanity witnessed the culmination of the most important scientific feat of the 21st century. The publicly-funded Human Genome Project published its landmark draft sequence in the journal Nature on 15 February 2001, while Celera Genomics released its own genome assembly in Science just one day later, on 16 February.
Together, the two publications marked a defining moment for modern biology, symbolising both collaboration and competition between public and private science.
The CRG's Roderic Guigó, at the time researcher at IMIM (now HMar Research Institute), alongside his PhD student at the time, Josep “Pep” F. Abril, were part of the Celera effort.
They contributed to the visual and computational tools that helped interpret and present the genome at a moment when the world was seeing humanity’s full genetic blueprint for the very first time. The Catalan researchers were the only two figures from all of Spain that took part in the efforts.
To mark this anniversary, we asked both to offer a first-hand perspective on what it was like to take part in the project. Their accounts also help explain why the founding of the Centre for Genomic Regulation in 2001, becoming fully operational in 2003, was far from coincidental.
By then, scientists understood that simply knowing the sequence of the human genome was not enough. The next challenge was to decipher how genes are regulated, interact and give rise to complex biological systems. Institutions such as the CRG emerged precisely at that inflection point, shifting the focus from reading the genetic code to understanding how it functions in living cells.
Roderic Guigó: “We knew we were part of something that would make history”
When I think about the human genome, the first thing that comes to mind is paper. Punched cards. Endless printed listings. I remember a time when programming meant punching holes in paper and waiting hours to find out whether the computer had understood you correctly.
That’s how I learnt to program at the University of Barcelona in the mid-1980s. Computers didn’t have screens. You fed in a card and the result came out on a sheet of paper. That very primitive relationship with machines shaped me, because it forced me to think with absolute precision. If you made a single typo, you lost everything. There was no undo button.
At the time I had a technical obsession. How does a cell know where a gene begins and ends? DNA is an extraordinarily long text with no spaces or punctuation. Our task was to find the words inside that text. I went to Temple Smith’s lab in Boston for my postdoc. He was one of the pioneers in developing algorithms to compare sequences. That’s where I learnt how biology could be tackled with mathematical tools. In the end, it’s all code.
In 1994, I returned to Barcelona and set up my own group at IMIM, now the Hospital del Mar Research Institute. We were small and had limited resources, but we were highly focused. We specialised in identifying genes and, above all, in visualising them. At the time that seemed like a secondary task, but it eventually became essential. Having data isn’t enough, you need to be able to see it to grasp its significance.
When talk of the Human Genome Project began to gather pace, I already sensed it would be a turning point. But reading about a project and becoming part of that environment are two very different things. When we went to the United States and worked with Celera Genomics, that’s when I truly felt we were involved in something historic. There was a concentration of talent and urgency unlike anything I’d seen before. It was science, but it was also a race against the clock.
Our contribution was creating the map of the human genome. It took the form of an enormous poster that allowed people to see the genome as if it were a map. Many people think it contained the full sequence, but that’s impossible. What we created was a visual abstraction showing gene densities, regions with different compositions and layers of annotation. It was like an atlas. From afar you saw continents while up close, cities. For the first time, you could contemplate the genome.
Over the years people have often asked me whether the promises of the Human Genome Project were fulfilled. The honest answer is that no, not in the radical way that had been announced. Some colleagues predicted we would all live to 120 or 140, but we know that isn’t the case. Nor have we cured every disease.
What it did change was the way we do biology. Today, a huge part of research would be unthinkable without genomic information. I also learnt an important lesson. The project succeeded because data was shared. Programs, sequences and tools circulated freely. Open science was the engine that made new discoveries possible.
With the benefit of hindsight, the human genome stopped looking like a finish line and started to look like a starting point. That’s why today I’m more interested in new horizons. Back then we were trying to understand the human book of like. Now the question is, what would happen if we could read the entire library of life?
That is why the most ambitious project now under way — even more ambitious than the Human Genome Project — is the Earth BioGenome Project. The idea of sequencing the genomes of all eukaryotic species on the planet is vital for understanding biodiversity, evolution and, ultimately, ourselves. Many species will disappear before we even know they exist. Preserving their genetic information is, in a sense, preserving part of the Earth’s biological history.
Josep “Pep” Abril: “I felt like I was at NASA”
My memory of the Human Genome Project is very different, that of the end of a night shift. I remember closing up a restaurant, stepping out into the street in the early hours and thinking I still had work to do. Sometimes I would head straight to the lab. The city was silent and the computers kept calculating.
Before I devoted myself to research, I worked in hospitality while finishing my degree. When I secured my first scholarship, I earned less money but gained time. Bioinformatics had one huge advantage: you could leave a program running and come back hours later. The machine kept working even when you weren’t there.
What fascinated me most was visualising data, turning numbers into something you could understand at a glance. In the late 1990s that meant constantly running into technical limits. Twenty-gigabyte hard drives that seemed infinite. Printers that took an age to reproduce an image. Processors that today would look like toys. But at the time, that was what we had.
Back then I was building software that allowed the genome to be represented as a map. It was actually software designed for printers. We began presenting it at conferences and Celera Genomics got in touch. I believe one of the people who wrote to us was Jennifer Wortman, who worked on annotation. We had produced a map of Drosophila, and they liked how it looked. The fly genome is “small” compared with the human one, but the problem was the same.
In fact, Celera demonstrated that it was possible to reconstruct the fly genome using faster methods originally developed for analysing simple bacterial genomes — a pilot test showing the same approach could be applied to more complex genomes such as the human one.
The opportunity came while I was in the middle of my PhD. We travelled from Barcelona to Rockville, Maryland, near the NIH campus. I stayed for about a month and a half and Roderic for a few weeks. It was a huge culture shock: enormous teams, cutting-edge technology, incredibly intense working rhythms. For me, it was like being at NASA.
In the end we managed to create an abstraction showing gene densities, regions with different compositions and layers of functional annotation. Large areas appeared almost empty — “terra incognita”. Most genes were still uncharacterised. It was an immense achievement and, at the same time, a long list of unanswered questions.
Over time I’ve seen that methodology filter into every field: virus tracking, agriculture, biotechnology, model organisms, cell regeneration… The genome didn’t become a magic key that solved everything, but it did become a cross-cutting tool. It’s a biological GPS, helping us locate the functional elements encoded in the genome. Today we take it for granted, but there was a time when it simply didn’t exist.
I’ve also become more aware of the risks of technology. Artificial intelligence, for example, can detect patterns we would never see by combining vast amounts of data, but it can also make us more dependent if we stop thinking for ourselves. It’s the timeless philosophical question: technology in itself is neither good nor bad — it all depends on how we choose to use it.
EN CASTELLANO
25º aniversario de la publicación del genoma humano: dos miradas de investigadores que formaron parte del hito más importante de la biología
Hace veinticinco años, presenciamos la culminación del logro científico más importante del siglo XXI.
El Proyecto Genoma Humano, financiado con fondos públicos, publicó el borrador de la secuencia en la revista Nature el 15 de febrero de 2001, mientras que Celera Genomics publicó su propio ensamblaje genómico en Science tan solo un día después, el 16 de febrero.
Ambas publicaciones marcaron un momento decisivo para la biología moderna, simbolizando tanto la colaboración como la competencia entre la ciencia pública y privada.
Roderic Guigó, del CRG pero en el momento investigador del IMIM (el actual HMar Research Institute), y su estudiante de doctorado, Josep “Pep” F. Abril, formaron parte del proyecto Celera.
Contribuyeron a las herramientas visuales y computacionales que ayudaron a interpretar y presentar el genoma en un momento en el que el mundo veía por primera vez el mapa genético completo de la humanidad. Fueron los únicos investigadores catalanes de toda España que participaron en el proyecto.
Para conmemorar este aniversario, les pedimos a ambos que nos contaran de primera mano cómo fue participar en el proyecto. Sus relatos también ayudan a explicar por qué la fundación del Centro de Regulación Genómica en 2001, que entró en pleno funcionamiento en 2003, no es casualiad.
No bastaba con conocer la secuencia del genoma humano. El siguiente reto era descifrar cómo se regulan los genes, cómo interactúan y cómo dan lugar a sistemas biológicos complejos. Instituciones como el CRG surgieron precisamente en ese punto de inflexión, desplazando el enfoque de la lectura del código genético a la comprensión de su funcionamiento en las células vivas.
Roderic Guigó: “Estábamos participando en algo que iba a hacer historia”
Cuando pienso en el genoma humano, lo primero que recuerdo es papel. Fichas perforadas. Listados impresos interminables. Recuerdo una época en la que programar significaba perforar cartón y esperar horas para saber si el ordenador había entendido lo que querías decirle.
Aprendí a programar así, en la Universidad de Barcelona, a mediados de los años ochenta. Los ordenadores no tenían pantalla. Ponías una ficha y el resultado salía en una hoja. Esa relación tan primitiva con las máquinas me marcó mucho, porque me obligó a pensar con precisión. Si te equivocabas en un carácter, lo perdías todo. No existía el botón de deshacer.
En esos momentos tenía una obsesión técnica. ¿Cómo sabe una célula dónde empieza y dónde acaba un gen? El ADN es un texto larguísimo sin espacios ni puntuación. Nuestra tarea era encontrar las “palabras” dentro de ese texto. Me fui a Boston a hacer el posdoctorado, al laboratorio de Temple Smith, que fue uno de los pioneros en desarrollar algoritmos para comparar secuencias. Allí aprendí cómo la biología podía abordarse con herramientas matemáticas. Al final todo es código.
En 1994 volví a Barcelona y monté mi propio grupo en el IMIM. Éramos pequeños, con recursos limitados, pero muy focalizados. Nos especializamos en identificar genes y, sobre todo, en visualizarlos. En aquella época eso parecía una tarea secundaria, pero con el tiempo se volvió esencial. Hay que poder ver los datos y entenderlos de un vistazo, no basta solo con tenerlos.
Cuando empezó a hablarse con fuerza del Proyecto Genoma Humano, yo ya intuía que aquello iba a ser un punto de inflexión. Pero una cosa es leer sobre un proyecto y otra es entrar a formar parte de ese entorno. Cuando fuimos a Estados Unidos y trabajamos con Celera Genomics, fue cuando realmente sentí que estábamos participando en algo que iba a hacer historia. Allí había una concentración de talento y de urgencia que no había visto antes. Era ciencia y también una carrera a contrarreloj.
Nuestra contribución fue el mapa del genoma humano, aquel póster enorme que permitía ver el genoma como un territorio. Mucha gente piensa que ahí estaba la secuencia completa, pero eso es imposible. Lo que hicimos fue una abstracción visual que contiene densidades de genes, regiones con distinta composición, capas de anotación. Era como un atlas. Desde lejos veías continentes y de cerca, ciudades. Por primera vez podías contemplar el genoma.
Con los años me han preguntado muchas veces si se cumplieron las promesas del Proyecto del Genoma Humano. La respuesta honesta es que no. No de la forma radical en que se anunciaba. Algunos colegas predecían que todos viviríamos hasta los 120 o 140 años, pero sabemos que no es así. Tampoco hemos curado todas las enfermedades.
Pero cambió la manera de hacer biología. Hoy gran parte de la investigación sería impensable sin información genómica. También aprendí una lección muy importante, que el proyecto avanzó porque los datos se compartieron. Porque programas, secuencias y herramientas circulaban libremente. La ciencia abierta fue el motor que hizo posibles los nuevos descubrimientos.
Con la perspectiva de los años, el genoma humano dejó de parecerme una meta y empezó a parecerme un punto de partida. Y por eso, hoy miro con más interés otros horizontes. Si entonces intentábamos entender el libro humano, ahora la pregunta es, ¿qué pasaría si pudiéramos leer la biblioteca entera de la vida?
Por eso el proyecto más ambicioso que existe ahora, incluso más que el proyecto del genoma humano, es el Earth BioGenome Project. La idea de secuenciar los genomas de todas las especies eucariotas del planeta es vital para entender la biodiversidad, la evolución y, en última instancia, a nosotros mismos. Muchas especies desaparecerán antes incluso de que sepamos que existen. Tener su información genética es, de alguna forma, preservar una parte de la historia biológica de la Tierra.
Josep “Pep” Abril: “Fue como estar en la NASA”
Yo recuerdo el proyecto del genoma humano con una imagen muy distinta: la salida de un turno de noche. Recuerdo cerrar un restaurante, salir a la calle de madrugada y pensar que aún me quedaba trabajo por hacer. A veces me iba directo al laboratorio. La ciudad estaba en silencio y los ordenadores seguían calculando.
Antes de dedicarme a la investigación trabajé en hostelería mientras acababa la carrera. Cuando conseguí mi primera beca, cobraba menos, pero gané tiempo. La bioinformática tenía una ventaja enorme, podías dejar un programa corriendo y volver horas después. La máquina seguía trabajando, aunque tú no estuvieras.
Lo que más me fascinaba era visualizar datos. Convertir números en algo que se pudiera entender de un vistazo. A finales de los noventa eso significaba enfrentarse a límites técnicos constantes. Discos duros de 20 gigas que nos parecían infinitos. Impresoras que tardaban una eternidad en reproducir una imagen. Procesadores que hoy nos parecerían de juguete. Pero en ese momento era lo que teníamos.
En esos momentos yo estaba construyendo un software que permitía representar el genoma como un mapa. ¡Era un software que se usaba para impresoras! Empezamos a presentarlo en conferencias y nos contactaron de Celera Genomics. Creo que una de las personas que nos escribió fue Jennifer Wortman, que trabajaba en anotación. Habíamos hecho un mapa de la mosca Drosophila, y les gustó cómo se veía. El genoma de la mosca es “pequeño” comparado con el humano, pero el problema era el mismo.
De hecho, Celera demostró que se podía reconstruir el genoma de la mosca a partir de métodos más rápidos desarrollados para analizar genomas sencillos de bacterias, como prueba piloto de que se podría aplicar también en genomas más complejos como el humano.
La oportunidad llegó cuando estaba en mitad de la tesis. Fuimos de Barcelona a Rockville, Maryland, cerca del entorno del NIH. Yo estuve allí aproximadamente un mes y medio y Roderic unas semanas. Fue un choque brutal. Equipos enormes, tecnología puntera, ritmos de trabajo intensísimos. Para mí fue como estar en la NASA.
Al final pudimos crear una abstracción que mostraba densidades de genes, regiones con distinta composición y capas de anotación funcional. Grandes regiones aparecían prácticamente vacías, “tierra incógnita”. La mayoría de los genes aún estaban por caracterizar. Era un logro inmenso y, al mismo tiempo, una lista de preguntas pendientes.
Con el paso del tiempo he visto cómo esa metodología se fue filtrando en todas partes. Seguimiento de virus, agricultura, biotecnología, organismos modelo, regeneración celular… El genoma no se convirtió en una llave mágica que lo resolvía todo, pero sí en una herramienta transversal. Es un GPS biológico, nos ayuda a encontrar los elementos funcionales codificados en este genoma. Hoy se da por hecho, pero hubo un momento en que no existía.
También me he vuelto más consciente de los riesgos de la tecnología. La inteligencia artificial, por ejemplo, puede detectar patrones que nosotros no veríamos nunca al combinar enormes cantidades de datos, pero también puede hacernos más dependientes si dejamos de pensar por nosotros mismos. Es la pregunta filosófica de todas las épocas, la tecnología en sí misma no es ni buena ni mala, sino que depende del uso que hagamos de ella.
EN CATALÀ
25è aniversari de la publicació del genoma humà: dues mirades d'investigadors que van formar part de la fita més important de la biologia
Fa 25 anys, vam presenciar la culminació de l'èxit científic més important del segle XXI.
El Projecte Genoma Humà, finançat amb fons públics, va publicar l'esborrany de la seqüència a la revista Nature el 15 de febrer del 2001, mentre que Celera Genomics va publicar el seu propi assemblatge genòmic a Science tan sols un dia després, el 16 de febrer.
Totes dues publicacions van marcar un moment decisiu per a la biologia moderna, simbolitzant tant la col·laboració com la competència entre la ciència pública i privada. Roderic Guigó, del CRG però en el moment investigador de l'IMIM (l'actual HMar Research Institute), i el seu estudiant de doctorat, Josep “Pep” F. Abril, van formar part del projecte Celera.
Van contribuir a les eines visuals i computacionals que van ajudar a interpretar i presentar el genoma en un moment en què el món veia per primera vegada el mapa. Van ser els únics investigadors catalans de tot l'Estat que van participar al projecte.
Per commemorar aquest aniversari, els demanem a tots dos que ens expliquessin de primera mà com va ser participar en el projecte.
Els seus relats també ajuden a explicar per què la fundació del Centre de Regulació Genòmica el 2001, que va entrar en ple funcionament el 2003, no és casual. No n'hi havia prou de conèixer la seqüència del genoma humà. El repte següent era desxifrar com es regulen els gens, com interactuen i com donen lloc a sistemes biològics complexos.
Institucions com el CRG van sorgir precisament en aquest punt d'inflexió i van desplaçar l'enfocament de la lectura del codi genètic a la comprensió del seu funcionament a les cèl·lules vives.
Roderic Guigó: "Participàvem en una iniciativa que faria història"
Quan penso en el genoma humà, el primer que recordo és paper. Fitxes perforades. Llistats impresos interminables. Recordo una època en què programar significava perforar cartró i esperar hores per saber si l'ordinador havia entès el que volies dir-li.
Vaig aprendre a programar així, a la Universitat de Barcelona, a mitjans dels anys vuitanta. Els ordinadors no tenien pantalla. Posaves una fitxa i el resultat sortia en un full. Aquesta relació tan primitiva amb les màquines em va marcar molt, perquè em va obligar a pensar amb precisió. Si t'equivocaves en un caràcter, ho perdies tot. No existia el botó de desfer.
En aquells moments tenia una obsessió tècnica. Com sap una cèl·lula on comença i on acaba un gen? L'ADN és un text llarguíssim sense espais ni puntuació. La nostra tasca era trobar les "paraules" dins d'aquest text. Me'n vaig anar a Boston a fer el postdoctorat, al laboratori de Temple Smith, que va ser un dels pioners a desenvolupar algoritmes per comparar seqüències. Allà vaig aprendre com la biologia podia abordar-se amb eines matemàtiques. Al cap i a la fi, tot és codi.
El 1994 vaig tornar a Barcelona i vaig muntar el meu propi grup a l'IMIM. Érem petits, amb recursos limitats, però molt focalitzats. Ens especialitzàrem a identificar gens i, sobretot, a visualitzar-los. En aquella època això semblava una tasca secundària, però amb el temps es va tornar essencial. Cal poder veure les dades i entendre-les d'una ullada, no n'hi ha prou només amb tenir-les.
Quan va començar a parlar-se amb força del Projecte Genoma Humà, jo ja intuïa que es convertiria en un punt d'inflexió. Però una cosa és llegir sobre un projecte i una altra és entrar a formar part d'aquest entorn. Quan vam anar als Estats Units i treballàrem amb Celera Genomics, va ser quan realment vaig sentir que estàvem participant en quelcom que faria història. Allà hi havia una concentració de talent i d'urgència que no havia vist abans. Era ciència i també una cursa contrarellotge.
La nostra contribució va ser el mapa del genoma humà, aquell pòster enorme que permetia veure el genoma com un territori. Molta gent pensa que contenia la seqüència completa, però això és impossible. El que vam fer va ser una abstracció visual que conté densitats de gens, regions amb diferent composició, capes d'anotació. Era com un atles. Des de lluny veies continents i de prop, ciutats. Per primera vegada podies contemplar el genoma.
Amb els anys m'han preguntat moltes vegades si es van complir les promeses del Projecte del Genoma Humà. La resposta honesta és que no. No de la forma radical en què s'anunciava. Alguns col·legues predeien que tots viuríem fins als 120 o 140 anys, però sabem que no és així. Tampoc hem curat totes les malalties.
Però va canviar la manera de fer biologia. Avui gran part de la investigació seria impensable sense informació genòmica. També vaig aprendre una lliçó molt important, que el projecte va avançar perquè les dades es van compartir. Perquè programes, seqüències i eines circulaven lliurement. La ciència oberta va ser el motor que va fer possibles els nous descobriments.
Amb la perspectiva dels anys, el genoma humà va deixar de semblar-me una meta i va començar a semblar-me un punt de partida. I per això, avui miro amb més interès altres horitzons. Si llavors intentàvem entendre el llibre humà, ara la pregunta és, què passaria si poguéssim llegir la biblioteca sencera de la vida?
Per això el projecte més ambiciós que existeix ara, fins i tot més que el projecte del genoma humà, és l'Earth BioGenome Project. La idea de seqüenciar els genomes de totes les espècies eucariotes del planeta és vital per entendre la biodiversitat, l'evolució i, en última instància, a nosaltres mateixos. Moltes espècies desapareixeran abans fins i tot que sapiguem que existeixen. Tenir la seva informació genètica és, d'alguna manera, preservar una part de la història biològica de la Terra.
Josep "Pep" Abril: "Va ser com estar a la NASA"
Jo recordo el projecte del genoma humà amb una imatge molt diferent: la sortida d'un torn de nit. Recordo tancar un restaurant, sortir al carrer de matinada i pensar que encara em quedava feina per fer. De vegades me n'anava directe al laboratori. La ciutat estava en silenci i els ordinadors seguien calculant.
Abans de dedicar-me a la recerca, mentre acabava la carrera, vaig treballar a l’hostaleria. Quan vaig aconseguir la meva primera beca, cobrava menys, però vaig guanyar temps. La bioinformàtica tenia un avantatge enorme, podies deixar un programa corrent i tornar hores després. La màquina seguia treballant, encara que tu no hi fossis.
El que més em fascinava era visualitzar dades. Convertir números en una cosa que es pogués entendre d'una ullada. A finals dels noranta això significava enfrontar-se a límits tècnics constants. Discs durs de 20 gigues que ens semblaven infinits. Impressores que trigaven una eternitat a reproduir una imatge. Processadors que avui ens semblarien de joguina. Però en aquell moment era el que teníem.
En aquells moments jo estava construint un programari que permetia representar el genoma com un mapa. Era un programari que es feia servir per a impressores! Vàrem començar a presentar-lo en conferències i ens van contactar de Celera Genomics. Crec que una de les persones que ens va escriure va ser la Jennifer Wortman, que treballava en anotació. Havíem fet un mapa de la mosca Drosophila, i els va agradar com es veia. El genoma de la mosca és "petit" comparat amb l'humà, però el problema era el mateix.
De fet, Celera va demostrar que es podia reconstruir el genoma de la mosca a partir de mètodes més ràpids desenvolupats per analitzar genomes senzills de bacteris, com a prova pilot que es podria aplicar també en genomes més complexos com l'humà.
L'oportunitat arribar quan estava a meitat de la tesi. Vam anar de Barcelona a Rockville, Maryland, a prop de l'entorn del NIH. Jo hi vaig estar aproximadament un mes i mig i el Roderic unes setmanes. Va ser un xoc brutal. Equips enormes, tecnologia capdavantera, ritmes de treball intensíssims. Per a mi va ser com estar a la NASA.
Al final vam poder crear una abstracció que mostrava densitats de gens, regions amb diferent composició i capes d'anotació funcional. Grans regions apareixien pràcticament buides, "terra incògnita". La majoria dels gens encara no estaven caracteritzats. Era un assoliment immens i, alhora, una llista de preguntes pendents.
Amb el pas del temps he vist com aquesta metodologia es va anar filtrant arreu. Seguiment de virus, agricultura, biotecnologia, organismes model, regeneració cel·lular... El genoma no es va convertir en una clau màgica que ho resolia tot, però sí en una eina transversal. És un GPS biològic, ens ajuda a trobar els elements funcionals codificats en aquest genoma. Avui es dona per fet, però hi va haver un moment en què no existia.
També m'he tornat més conscient dels riscos de la tecnologia. La intel·ligència artificial, per exemple, pot detectar patrons que nosaltres no veuríem mai en combinar enormes quantitats de dades, però també pot fer-nos més dependents si deixem de pensar per nosaltres mateixos. És la pregunta filosòfica de totes les èpoques, la tecnologia en si mateixa no és ni bona ni dolenta, sinó que depèn de l'ús que en fem.

