You are here

    • You are here:
    • Home > Artificial intelligence applied to the genome identifies an unknown human ancestor

Artificial intelligence applied to the genome identifies an unknown human ancestor


Wed, 16/01/2019 - 13:50

Artificial intelligence applied to the genome identifies an unknown human ancestor

By combining deep learning algorithms and statistical methods, researchers have identified, in the genome of Asiatic individuals, the footprint of a new hominid who cross bred with its ancestors tens of thousands of years ago.


By combining deep learning algorithms and statistical methods, investigators from the Institute of Evolutionary Biology (IBE), the Centro Nacional de Análisis Genómico (CNAG-CRG) of the Centre for Genomic Regulation (CRG) and the Institute of Genomics at the University of Tartu have identified, in the genome of Asiatic individuals, the footprint of a new hominid who cross bred with its ancestors tens of thousands of years ago.

Modern human DNA computational analysis suggests that the extinct species was a hybrid of Neanderthals and Denisovans and cross bred with Out of Africa modern humans in Asia. This finding would explain that the hybrid found this summer in the caves of Denisova–the offspring of a Neanderthal mother and a Denisovan father–, was not an isolated case, but rather was part of a more general introgression process.

The study, published in Nature Communications, uses deep learning for the first time ever to account for human evolution, paving the way for the application of this technology in other questions in biology, genomics and evolution.

Humans had descendants with an species that is unknown to us

One of the ways of distinguishing between two species is that while both of them may cross breed, they do not generally produce fertile descendants. However, this concept is much more complex when extinct species are involved. In fact, the story told by current human DNA blurs the lines of these limits, preserving fragments of hominids from other species, such as the Neanderthals and the Denisovans, who coexisted with modern humans more than 40,000 years ago in Eurasia.

Now, investigators of the Institute of Evolutionary Biology (IBE), the Centro Nacional de Análisis Genómico (CNAG-CRG) of the Centre for Genomic Regulation (CRG), and the University of Tartu have used deep learning algorithms to identify a new and hitherto-unknown ancestor of humans that would have interbred with modern humans tens of thousands of years ago. “About 80,000 years ago, the so-called Out of Africa occurred, when part of the human population, which already consisted of modern humans, abandoned the African continent and migrated to other continents, giving rise to all the current populations”, explained Jaume Bertranpetit, principal investigator at the IBE and head of Department at the UPF. “We know that from that time onwards, modern humans cross bred with Neanderthals in all the continents, except Africa, and with the Denisovans in Oceania and probably in South-East Asia, although the evidence of cross-breeding with a third extinct species had not been confirmed with any certainty”.

Deep learning: deciphering the keys to human evolution in ancient DNA

Hitherto, the existence of the third ancestor was only a theory that would explain the origin of some fragments of the current human genome (part of the team involved in this study had already posed the existence of the extinct hominid in a previous study). However, deep learning has made it possible to make the transition from DNA to the demographics of ancestral populations.

The problem the investigators had to contend with is that the demographic models they have analysed are much more complex than anything else considered to date and there were no statistic tools available to analyse them. Deep learning “is an algorithm that imitates the way in which the nervous system of mammals works, with different artificial neurons that specialise and learn to detect, in data, patterns that are important for performing a given task”, stated Òscar Lao, principal investigator at the CNAG-CRG and an expert in this type of simulations. “We have used this property to get the algorithm to learn to predict human demographics using genomes obtained through hundreds of thousands of simulations. Whenever we run a simulation we are travelling along a possible path in the history of humankind. Of all simulations, deep learning allows us to observe what makes the ancestral puzzle fit together”.

It is the first time that deep learning has been used successfully to explain human history, paving the way for this technology to be applied in other questions in biology, genomics and evolution.

An extinct hominid could explain the history of humankind

The deep learning analysis has revealed that the extinct hominid is probably a descendant of the Neanderthal and Denisovan populations. The discovery of a fossil with these characteristics this summer would seem to endorse the study finding, consolidating the hypothesis of this third species or population that coexisted with modern human beings and mated with them. “Our theory coincides with the hybrid specimen discovered recently in Denisova, although as yet we cannot rule out other possibilities”, said Mayukh Mondal, an investigator of the University of Tartu and former investigator at the IBE.

Reference article: Mayukh Mondal, Jaume Bertranpetit and Oscar Lao. Approximate Bayesian computation with Deep Learning supports a third archaic introgression in Asia and Oceania; Nature Communications (2018). DOI: 10.1038/s41467-018-08089-7

Media contact: 
Laia Cendrós Ollé, press officer, Centre for Genomic Regulation (CRG) - Tel. +34 93 316 02 37 

About the Institute of Evolutionary Biology (IBE: CSIC- Pompeu Fabra University)
The Institute of Evolutionary Biology (IBE) is a mixed institute of the Pompeu Fabra University (UPF) and the Higher Council of Scientific Research (CSIC) created in Barcelona in 2008. The IBE’s investigators study the processes and mechanisms that generate biodiversity, and its research lines straddle topics such as genetic and molecular evolution, population biology, complex systems biology and the recovery of ancient DNA. The institute has more than one hundred and twenty employees working in two adjacent buildings: the Barcelona Biomedical Research Park (PRBB) and the Mediterranean Center for Marine and Environmental Research (CMIMA).

About the Centro Nacional de Análisis Genómico (CNAG-CRG)
The CNAG-CRG is located in Barcelona and is one of the European research facilities with the greatest sequencing capacity. It was created in 2009, and its mission is to conduct nucleic acid analysis projects in collaboration with the national and international scientific community. It is a non-profit organisation funded by the Ministry of Science, Innovation and Universities and the Government of Catalonia through the Economy and Knowledge Department and the Health Department. It has been part of the Centre for Genomic Regulation (GRC) since 2015.

The centre focuses on genome sequencing and analysis projects in areas such as cancer genetics, rare disorders, host-pathogen interactions, the annotation and assembly of new genomes, evolutionary biology and the improvement of species of agricultural interest in collaboration with universities, hospitals, research centres and companies in the biotechnology and pharmaceutical industry.


La inteligencia artificial aplicada al genoma identifica un antepasado humano desconocido

A través de la combinación de algoritmos de deep learning y métodos estadísticos, investigadores del Instituto de Biología Evolutiva (IBE), el Centro Nacional de Análisis Genómico (CNAG-CRG) del Centro de Regulación Genómica (CRG) y del Instituto de Genómica de la Universidad de Tartu, identifican en el genoma de individuos asiáticos la huella de  un nuevo homínido que se cruzó con sus antepasados hace decenas de miles de años.

El análisis computacional del ADN humano actual apunta a que la especie desaparecida fue un híbrido de neandertales y denisovanos y se cruzó en Asia con los humanos modernos, salidos del “Out of Africa”. Este hallazgo explicaría que el híbrido encontrado esta verano en las cuevas de Denísova - fruto de madre neandertal y padre denisovano - no fuera un caso aislado, sino parte de un proceso de mezcla más general.

El estudio, publicado en Nature Communications, utiliza por primera vez el deep learning para explicar la evolución humana, abriendo la puerta a que esta tecnología se extienda a otras preguntas en biología, genómica y evolución.

Los humanos tuvieron descendencia con una especie que desconocemos

Una de las formas de distinguir a dos especies es que aunque ambas puedan cruzarse, generalmente no producen descendencia fértil. Sin embargo, este concepto es más complejo al hablar de especies extinguidas. De hecho, el ADN humano actual cuenta una historia que desdibuja estos límites, conservando fragmentos de homínidos de otras especies, como los neandertales y los denisovanos, que coexistieron con el humano moderno hace más de 40000 años en Eurasia.

Ahora investigadores del IBE, el CNAG-CRG y la Universidad de Tartu identifican con algoritmos de deep learning un nuevo antepasado de los humanos desconocido hasta la fecha que se habría cruzado con el hombre moderno hace decenas de miles de años. “Hace unos 80000 años se produjo el conocido Out of Africa, cuando una parte de la población humana que ya era de humanos modernos, abandonó el continente africano y se extendió a otros continentes, dando lugar a todas las poblaciones actuales”, comenta Jaume Bertranpetit, investigador principal en el IBE y catedrático de la UPF. “A partir de entonces, sabíamos que se produjeron cruces de humanos modernos con los neandertales en todos los continentes menos en África y con los denisovanos en Oceanía y seguramente el Sudeste de Asia, pero la evidencia de cruces con una tercera especie extinta aún no se había confirmado con certeza”.

Deep learning: descifrando las claves de la evolución humana en el ADN antiguo

Hasta ahora, la existencia del tercer antepasado era sólo una teoría que explicaría el origen de algunos fragmentos del genoma humano actual (parte del equipo de este estudio ya planteó la existencia del homínido extinto en un estudio anterior. Pero ha sido el uso del deep learning lo que ha permitido pasar del ADN a la demografía de las poblaciones ancestrales.

El problema al que se han enfrentado los investigadores es que los modelos demográficos que han analizado son de una complejidad muy superior a la que hasta ahora se había considerado, y no existían herramientas estadísticas para su análisis. El deep learning “es un algoritmo que imita la manera en que funciona el sistema nervioso de los mamíferos, con diferentes neuronas artificiales que se especializan y aprenden a detectar en los datos aquellos patrones que son importantes para llevar a cabo una tarea determinada”, comenta Òscar Lao, investigador principal en el CNAG-CRG y experto en este tipo de simulaciones. “Nosotros hemos usado esta propiedad para hacer que el algoritmo aprendiese a predecir la demografía humana usando genomas obtenidos a través de cientos de miles de simulaciones. Cada vez que realizamos una simulación estamos recorriendo un posible camino de la historia de la humanidad. De entre todas las simulaciones, el deep learning nos permite fijarnos en la que hace que el puzle ancestral encaje”.

Es la primera vez que se utiliza el deep learning con éxito para explicar la historia humana, abriendo la puerta a que esta tecnología se extienda a otras preguntas en biología, genómica y evolución.

Un homínido extinto podría explicar la historia de la humanidad

El análisis deep learning ha revelado que  el homínido extinto es probablemente descendiente de  poblaciones neandertales y denisovanas. El descubrimiento de un fósil de estas características este verano encajaría con el resultado de este estudio, consolidando la hipótesis de esta tercera especie o población que coexistió con los humanos modernos y se apareó con ellos. “Nuestra teoría encaja con el ejemplar híbrido descubierto recientemente en Denisova, pero aún no podemos descartar otras posibilidades”, comenta Mayukh Mondal, investigador en la Universidad de Tartu y anteriormente investigador en el IBE.


Artículo de referencia: Mayukh Mondal, Jaume Bertranpetit, Oscar Lao. Approximate Bayesian computation with Deep Learning supports a third archaic introgression in Asia and Oceania; Nature Communications (2018). DOI: 10.1038/s41467-018-08089-7

Contacto para medios: 
Laia Cendrós Ollé, oficina de prensa, Centro de Regulación Genómica (CRG) - Tel. +34 93 316 02 37.


Sobre el Instituto de Biología Evolutiva (IBE: CSIC-Universitat Pompeu Fabra)

El Instituto de Biología Evolutiva (IBE) es un instituto mixto de la Universidad Pompeu Fabra (UPF) y el Consejo Superior de Investigaciones Científicas (CSIC) creado en 2008 en Barcelona. Los investigadores del IBE estudian los procesos y los mecanismos que generan la biodiversidad, y sus líneas de investigación abarcan temas como la evolución genética y molecular, la biología de poblaciones, la biología de sistemas complejos y la recuperación del ADN antiguo. El instituto cuenta con más de ciento veinte trabajadores, que se distribuyen entre dos edificios vecinos: el Parque de Investigación Biomédica de Barcelona (PRBB) y el Centro Mediterráneo de Investigaciones Marinas y Ambientales (CMIMA).

Sobre el Centro Nacional de Análisis Genómico (CNAG-CRG)

El CNAG-CRG está ubicado en Barcelona y es uno de los centros europeos con mayor capacidad de secuenciación. Se creó en 2009 con la misión de llevar a cabo proyectos de análisis de ácidos nucleicos en colaboración con la comunidad científica nacional e internacional. Es una organización sin ánimo de lucro financiada por el Ministerio de Ciencia, Innovación y Universidades y la Generalitat de Catalunya mediante el departamento de Empresa y Conocimiento y el departamento de Salud. Desde 2015 forma parte del Centro de Regulación Genómica (CRG).

El centro está focalizado en proyectos de secuenciación y análisis en áreas como la genética del cáncer, las enfermedades raras, las interacciones huésped-patógeno, la anotación y ensamblaje de nuevos genomas, la biología evolutiva y la mejora de especies de interés para la agricultura, en colaboración con universidades, hospitales, centros de investigación y empresas del sector de la biotecnología y la farma. -



La intel·ligència artificial aplicada al genoma identifica un avantpassat humà desconegut 

A través de la combinació d'algoritmes de deep learning i mètodes estadístics, investigadors de l'Institut de Biologia Evolutiva (IBE), el Centre Nacional d'Anàlisi Genòmica (CNAG-CRG) del Centre de Regulació Genòmica (CRG) i de l'Institut de Genòmica de la Universitat de Tartu, identifiquen en el genoma d'individus asiàtics la petjada d'un nou homínid que es va creuar amb els seus avantpassats fa desenes de milers d'anys.

L'anàlisi computacional de l'ADN humà actual apunta al fet que l'espècie desapareguda va ser un híbrid de neandertals i denissovans i es va creuar a Àsia amb els humans moderns, sortits de l’“Out of Africa”. Aquesta troballa explicaria que l'híbrid trobat aquest estiu a les coves de Deníssova - fruit de mare neandertal i pare denissovà - no fos un cas aïllat, sinó part d'un procés de mescla més general.

L'estudi, publicat en Nature Communications, utilitza per primera vegada el deep learning per a explicar l'evolució humana, obrint la porta al fet que aquesta tecnologia s'estengui a altres preguntes en biologia, genòmica i evolució.

Els humans van tenir descendència amb una espècie que desconeixem

Una de les maneres de distingir a dues espècies és que encara que ambdues puguin creuar-se, generalment no produeixen descendència fèrtil. No obstant això, aquest concepte és més complex en parlar d'espècies extingides. De fet, l'ADN humà actual compte una història que desdibuixa aquests límits, conservant fragments d'homínids d'altres espècies, com els neandertals i els denissovans, que van coexistir amb l'humà modern fa més de 40000 anys a Euràsia.

Ara investigadors de l'IBE, el CNAG-CRG i la Universitat de Tartu identifiquen amb algorismes de deep learning un nou avantpassat dels humans desconegut fins avui que s'hauria creuat amb l'home modern fa desenes de milers d'anys. “Fa uns 80000 anys es va produir el conegut Out of Africa, quan una part de la població humana que ja era d'humans moderns, va abandonar el continent africà i es va estendre a altres continents, donant lloc a totes les poblacions actuals”, comenta Jaume Bertranpetit, investigador principal a l'IBE i catedràtic de la UPF. “A partir de llavors, sabíem que es van produir encreuaments d'humans moderns amb els neandertals en tots els continents menys a Àfrica i amb els denissovans a Oceania i segurament el Sud-est d'Àsia, però l'evidència d'encreuaments amb una tercera espècie extinta encara no s'havia confirmat amb certesa”.

Deep learning: desxifrant les claus de l'evolució humana en l'ADN antic

Fins ara, l'existència del tercer avantpassat era només una teoria que explicaria l'origen d'alguns fragments del genoma humà actual (part de l'equip d'aquest estudi ja va plantejar l'existència de l'homínid extint en un estudi anterior). Però ha estat l'ús del deep learning el que ha permès passar de l'ADN a la demografia de les poblacions ancestrals.

El major problema que han hagut d’afrontar els investigadors ha estat l’anàlisi de models demogràfics molt més complexos que els que s'havien considerat fins ara, i pels quals no existien eines estadístiques d’anàlisi. El deep learning “és un algorisme que imita la manera com funciona el sistema nerviós dels mamífers, amb diferents neurones artificials que s'especialitzen i aprenen a detectar en les dades aquells patrons que són importants per a dur a terme una tasca determinada”, comenta Òscar Lao, investigador principal en el CNAG-CRG i expert en aquest tipus de simulacions. “Nosaltres hem aprofitat aquesta propietat per a fer que l'algorisme aprengués a predir la demografia humana usant genomes obtinguts a través de centenars de milers de simulacions. Cada vegada que realitzem una simulació estem recorrent un possible camí de la història de la humanitat. D’entre totes les simulacions, el deep learning ens permet fixar-nos en aquella que fa que el puzle ancestral encaixi”.

És la primera vegada que s'utilitza el deep learning amb èxit per a explicar la història humana, obrint la porta al que s'estengui l’ús d’aquesta tecnologia per respondre altres preguntes en biologia, genòmica i evolució.

Un homínid extint podria explicar la història de la humanitat

L'anàlisi deep learning ha revelat que l'homínid extint és probablement descendent de poblacions neandertals i denissovanes. El descobriment d'un fòssil d'aquestes característiques aquest estiu encaixaria amb el resultat d'aquest estudi, consolidant la hipòtesi d'aquesta tercera espècie o població que va coexistir amb els humans moderns i es va creuar amb ells. “La nostra teoria encaixa amb l'exemplar híbrid descobert recentment a Deníssova, però encara no podem descartar altres possibilitats”, comenta Mayukh Mondal, investigador a la Universitat de Tartu i anteriorment investigador a l'IBE.


Article de referència: Mayukh Mondal, Jaume Bertranpetit, Oscar Lao. Approximate Bayesian computation with Deep Learning supports a third archaic introgression in Asia and Oceania; Nature Communications (2018). DOI: 10.1038/s41467-018-08089-7

Contacte per a mitjans: Laia Cendrós Ollé, responsable de premsa del CRG - Tel. +34 93 316 02 37


Sobre l'Institut de Biologia Evolutiva (IBE: CSIC-Universitat Pompeu Fabra)

L'Institut de Biologia Evolutiva (IBE) és un institut mixt de la Universitat Pompeu Fabra (UPF) i el Consell Superior de Recerques Científiques (CSIC) fundat al 2008 a Barcelona. Els investigadors de l’IBE estudien els processos i els mecanismes que generen la biodiversitat, i les seves línies de recerca abasten temes com l'evolució genètica i molecular, la biologia de poblacions, la biologia de sistemes complexos i la recuperació de l'ADN antic. L'institut compta amb més de cent vint treballadors, que es distribueixen entre dos edificis veïns: el Parc de Recerca Biomèdica de Barcelona (PRBB) i el Centre Mediterrani de Recerques Marines i Ambientals (CMIMA).

Sobre el Centre Nacional d’Anàlisi Genòmica (CNAG-CRG)

El CNAG-CRG està situat a Barcelona i és un dels centres europeus amb major capacitat de seqüenciació. Es va crear al 2009 amb la missió de dur a terme projectes d'anàlisi d'àcids nucleics en col·laboració amb la comunitat científica nacional i internacional. És una organització sense ànim de lucre finançada pel Ministeri de Ciència, Innovació i Universitats i la Generalitat de Catalunya mitjançant el departament d'Empresa i Coneixement i el departament de Salut. Des de 2015 forma part del Centre de Regulació Genòmica (CRG).

El centre està focalitzat en projectes de seqüenciació i anàlisi en àrees com la genètica del càncer, les malalties estranyes, les interaccionis hoste-patogen, l'anotació i assemblatge de nous genomes, la biologia evolutiva i la millora d'espècies d'interès per a l'agricultura, en col·laboració amb universitats, hospitals, centres de recerca i empreses del sector de la biotecnologia i la farma. -