You are here

    • You are here:
    • Home > Cloud system facilitates transcontinental human data exchange

Cloud system facilitates transcontinental human data exchange

NEWS

24
Jan
Thu, 24/01/2019 - 11:17

Cloud system facilitates transcontinental human data exchange

CINECA Project_Credit: Spencer Philips, EMBL’s European Bioinformatics Institute

CINECA project will unite more than a million human data sets from across Africa, Canada and Europe.

EN ESPAÑOL - EN CATALÀ

  • A new cloud-based data collaboration makes human omics data from more than a million individuals accessible to authorised researchers
  • Federated data sharing will now be possible on an unprecedented scale through the transcontinental CINECA project
  • Enabling secure access to clinical research data will help accelerate disease research, drug development and discoveries

Registered researchers will be able to analyse population-scale genomic and biomolecular data with the launch of the Common Infrastructure for National Cohorts in Europe, Canada and Africa (CINECA), an international project led by EMBL’s European Bioinformatics Institute (EMBL-EBI) with participation of the Centre for Genomic Regulation. A virtual cohort of data from 1.4 million individuals will be made accessible to approved researchers around the world through CINECA’s federated cloud-based network.

Rapid access to clinical research data allows scientists to share their findings and reduce the need to duplicate costly studies. This accelerates research and helps advance benefits to patients through the responsible sharing of genetic, phenotypic and life-style data on an unprecedented scale.

Comprised of 18 partner organisations* across three continents, CINECA is composed of data from 11 cohorts selected to provide a diverse representation of studies in rare disease, common disease and national cohorts over time (longitudinal).

Personalised medicine

Within the next five years it is predicted that the majority of human genomes will be generated through national-scale healthcare initiatives. Federated analysis tools, such as those within the CINECA initiative, could help identify relevant treatments for patients on an individual basis and it is hoped that, in the near future, the cloud will be utilised by personalised medicine programmes worldwide.

"By enabling access to genetic data from diverse human populations, CINECA will support the development of treatments tailored to each individual patient's genetic profile, the ultimate goal of personalised medicine," says Thomas Keane, Team Leader at EMBL-EBI. “Clinicians need to be able to compare a patient’s genome to a large set of healthy people and sick people, in order to understand the underlying genetics of the patient. And by “large”, we mean hundreds of thousands or even millions of other people.”

Jordi Rambla, Team Leader of the European Genome-Phenome Archive (EGA) at the Centre for Genomic Regulation (CRG), Barcelona, said: “It is all about sharing. The broader the scope of available data, the more useful they will be. We will bring EGA expertise, knowledge and capacity to this project, so we move forward towards more accessible genomic and biomolecular data across international borders and under harmonised search framework to better understand diseases.”

Tools for discovery

A key aim of CINECA is to develop tools which allow for rapid data discovery, secure access and authorisation within the cloud. Such tools will enable researchers to quickly discover data which are relevant to ongoing research projects, without duplicating studies. This raises the potential for novel discoveries into causes of rare and common disease such as cancer and diabetes.

“The project provides an avenue for us to align with international best practices, and contribute to these from an African and resource-limited perspective,” says Nicola Mulder, Head of Computational Biology at University of Cape Town and Principle Investigator of H3ABioNet (a Pan African bioinformatics network for H3Africa). “At the same time as contributing our own expertise in working with diverse African genetic data, we hope to gain experience in new technologies for data sharing and clinical implementations.”

The challenges

Federated international sharing of human data presents ethical and technical challenges, and is a task tightly embedded within the CINECA project. Delivering a solution to meet all ethical and security requirements for the international sharing of health data is a key aim of the project, providing the base upon which CINECA operates.

To protect patient privacy, access to the federated data cohorts will follow the established structure used by the Global Alliance for Genomics and Health (GA4GH), where researchers must formally apply for data access on an individual basis.

“This project is a large scale implementation of almost all of the GA4GH standards, in particular, data use and Researcher ID standards,” says Keane. “The goal of this implementation is to accelerate the process of accessing datasets in a safe and secure way. “All the control of the datasets remains with the local cohorts, as we’re not trying to create a centralised resource, but a federated one.”

Partners:

  • European Molecular Biology Laboratory (EMBL) - Germany
  • IT Center for Science (CSC) - Finland
  • University Applied Sciences Western Switzerland (HES-SO) - Switzerland
  • SIB Swiss Institute of Bioinformatics (SIB) - Switzerland
  • ERASMUS University Medical Centre Rotterdam (EMC) - Netherlands
  • Royal Institution for the Advancement of Learning, McGill University (MCG) - Canada
  • The Hospital for Sick Children (SickKids) - Canada
  • University of Cape Town (UCT) - South Africa
  • National Institute for Health and Medical Research (INSERM) - France
  • University of Tartu (UTARTU) - Estonia
  • Clinicalgeno Limited (Clinicageno) - United Kingdom
  • Centre for Genomic Regulation (CRG) - Spain
  • University Medical Center Groningen (UMCG) - Netherlands
  • The Chancellor, Masters and Scholars of the University of Oxford (UOXF) - United Kingdom
  • Simon Fraser University (SFU) - Canada
  • The Hyve BV (The Hyve) - Netherlands
  • Masaryk University (MU) - Czech Republic
  • Biobank and Biomolecular Resource Research Infrastructure Consortium (BBMRI-ERIC) - Austria

Funding information:
This project has received funding from the European Union’s Horizon 2020 research and innovation programme under grant agreement No 825775.

About the European Genome-phenome Archive (EGA) at the Centre for Genomic Regulation (CRG)

The European Genome-phenome Archive (EGA) is a service for permanent archiving and sharing of all types of personally identifiable genetic and phenotypic data resulting from biomedical research projects. The EGA contains exclusive data collected from individuals whose consent agreements authorise data release only for specific research use or to bona fide researchers. The EGA provides the necessary security required to control access, and maintain patient confidentiality, while providing access to those researchers and clinicians authorised to view the data.

Since 2014, and thanks to the support the “la Caixa” Foundation, the Catalan Government, and the Spanish Ministry of Economy, Industry and Competitiveness, the Centre for Genomic Regulation (CRG) co-manages the EGA together with the European Bioinformatics Institute (EMBI-EBIL) in the United Kingdom. In addition to maintaining and distributing data, the CRG EGA team enrich the contents of the EGA contributing with their knowledge about genomics and the relationship between genomes and phenomes.In Barcelona, the EGA data are stored in the Barcelona Supercomputing Centre - National Supercomputing Centre (BSC-CNS). 

 

Further information and media contact:
Laia Cendrós, press officer, Centre for Genomic Regulation (CRG) - Tel. +34 933160237.

 


EN ESPAÑOL

El sistema en la nube facilita el intercambio de datos humanos transcontinentales

El proyecto CINECA unirá más de un millón de conjuntos de datos humanos de África, Canadá y Europa.

  • Un nuevo proyecto de colaboración basado en datos en la nube hace que los datos -ómicos humanos de más de un millón de personas sean accesibles a investigadores autorizados.

  • El intercambio federado de datos ahora será posible en una escala sin precedentes a través del proyecto CINECA transcontinental

  • Permitir el acceso seguro a los datos de investigación clínica ayudará a acelerar la investigación de enfermedades, el desarrollo de medicamentos y los descubrimientos.

 

Los investigadores registrados podrán analizar datos genómicos y biomoleculares a escala poblacional con el lanzamiento de la Infraestructura Común para Cohortes Nacionales en Europa, Canadá y África (CINECA), un proyecto internacional liderado por el Instituto Europeo de Bioinformática EMBL (EMBL-EBI) con participación del Centro de Regulación Genómica. Una cohorte virtual de datos de 1,4 millones de individuos se pondrá a disposición de investigadores aprobados de todo el mundo a través de la red federada de la nube de CINECA.

El acceso rápido a los datos de investigación clínica permite a los científicos compartir sus hallazgos y reducir la necesidad de duplicar estudios costosos. Esto acelera la investigación y ayuda a mejorar los beneficios para los pacientes mediante el intercambio responsable de datos genéticos, fenotípicos y de estilo de vida en una escala sin precedentes.

Compuesta por 18 organizaciones asociadas en tres continentes, CINECA se compone de datos de 11 cohortes seleccionadas para proporcionar una representación diversa de estudios sobre enfermedades raras, enfermedades comunes y cohortes nacionales a lo largo del tiempo (longitudinal).

Medicina personalizada

En los próximos cinco años se prevé que la mayoría de los genomas humanos se generarán a través de iniciativas de atención médica a escala nacional. Las herramientas de análisis federadas, como las de la iniciativa CINECA, podrían ayudar a identificar tratamientos relevantes para los pacientes de forma individual y se espera que, en un futuro próximo, la nube sea utilizada por programas de medicina personalizada en todo el mundo.

"Al permitir el acceso a datos genéticos de diversas poblaciones humanas, CINECA apoyará el desarrollo de tratamientos a la medida del perfil genético de cada paciente, el objetivo final de la medicina personalizada", dice Thomas Keane, jefe de equipo en EMBL-EBI. “Los médicos clínicos deben poder comparar el genoma de un paciente con un gran conjunto de personas sanas y enfermas, para comprender la genética subyacente del paciente. Y por "gran conjunto", queremos decir cientos de miles o incluso millones de otras personas".

Jordi Rambla, jefe del equipo del Archivo Europeo de Genomas y Fenomas (EGA) en el Centro de Regulación Genómica (CRG) de Barcelona, ​​añade: "Se trata de compartir. Cuanto más amplio sea el alcance de los datos disponibles, más útiles serán. Llevaremos la experiencia, el conocimiento y la capacidad de EGA a este proyecto, por lo que avanzamos hacia datos genómicos y biomoleculares más accesibles a través de las fronteras internacionales y bajo un marco de búsqueda armonizado para comprender mejor las enfermedades".

Herramientas para el descubrimiento

Un objetivo clave de CINECA es desarrollar herramientas que permitan el descubrimiento rápido de datos, el acceso seguro y la autorización dentro de la nube. Estas herramientas permitirán a los investigadores descubrir rápidamente datos relevantes para proyectos de investigación en curso, sin duplicar estudios. Esto aumenta el potencial de nuevos descubrimientos sobre las causas de enfermedades raras y comunes, como el cáncer y la diabetes.

“El proyecto nos proporciona una vía para alinearnos con las mejores prácticas internacionales y contribuir a ellas desde una perspectiva africana y con recursos limitados”, dice Nicola Mulder, directora de biología computacional de la universidad de Ciudad del Cabo e investigadora principal de la Red de bioinformática africana H3ABioNet). "Al mismo tiempo que contribuimos con nuestra propia experiencia en el trabajo con diversos datos genéticos de África, esperamos obtener experiencia en nuevas tecnologías para el intercambio de datos e implementaciones clínicas".

Los desafios

El intercambio internacional federado de datos humanos presenta desafíos éticos y técnicos, los cuales constituyen una tarea integrada dentro del proyecto CINECA. Ofrecer una solución que cumpla con todos los requisitos éticos y de seguridad para el intercambio internacional de datos de salud es un objetivo clave del proyecto, y proporciona la base sobre la cual CINECA opera.

Para proteger la privacidad del paciente, el acceso a las cohortes de datos federados seguirá la estructura establecida utilizada por la Alianza Global para la Genómica y la Salud (GA4GH), donde los investigadores deben solicitar formalmente el acceso a los datos de forma individual. "Este proyecto es una implementación a gran escala de casi todos los estándares de GA4GH, en particular, el uso de datos y los estándares de identificación del investigador", dice Keane. “El objetivo de esta implementación es acelerar el proceso de acceso a los conjuntos de datos de forma segura. Todo el control de los conjuntos de datos permanece con las cohortes locales, ya que no estamos tratando de crear un recurso centralizado, sino uno federado".

 

Listado de socios en este proyecto:

  • European Molecular Biology Laboratory (EMBL) - Germany
  • IT Center for Science (CSC) - Finland
  • University Applied Sciences Western Switzerland (HES-SO) - Switzerland
  • SIB Swiss Institute of Bioinformatics (SIB) - Switzerland
  • ERASMUS University Medical Centre Rotterdam (EMC) - Netherlands
  • Royal Institution for the Advancement of Learning, McGill University (MCG) - Canada
  • The Hospital for Sick Children (SickKids) - Canada
  • University of Cape Town (UCT) - South Africa
  • National Institute for Health and Medical Research (INSERM) - France
  • University of Tartu (UTARTU) - Estonia
  • Clinicalgeno Limited (Clinicageno) - United Kingdom
  • Centre for Genomic Regulation (CRG) - Spain
  • University Medical Center Groningen (UMCG) - Netherlands
  • The Chancellor, Masters and Scholars of the University of Oxford (UOXF) - United Kingdom
  • Simon Fraser University (SFU) - Canada
  • The Hyve BV (The Hyve) - Netherlands
  • Masaryk University (MU) - Czech Republic
  • Biobank and Biomolecular Resource Research Infrastructure Consortium (BBMRI-ERIC) - Austria

 

Información sobre financiación:
Este proyecto ha recibido fondos del programa de investigación e innovación Horizon 2020 de la Unión Europea en virtud del acuerdo de subvención nº 825775.

Sobre el Archivo Europeo Genomas y Fenomas (EGA) en el Centro de Regulación Genómica (CRG)

El Archivo Europeo Genomas y Fenomas (EGA) es un servicio de archivo permanente y de intercambio de todo tipo de datos genéticos y fenotípicos identificables personalmente a partir de proyectos de investigación biomédica. El EGA contiene datos exclusivos recopilados de individuos que autorizan la cesión de sus datos sólo para un uso específico de investigación. El EGA proporciona la seguridad necesaria para controlar el acceso y mantener la confidencialidad del paciente, proporcionando acceso a los investigadores y médicos autorizados para ver los datos.

Desde el 2014 y gracias al apoyo de la Fundación "la Caixa", la Generalitat de Catalunya y el Ministerio de Economía, Industria y Competitividad, el Centro de Regulación Genómica (CRG) gestiona el EGA junto con el Instituto Europeo de Bioinformática (EMBL-EBI) en el Reino Unido. Además de mantener y distribuir datos, el equipo del EGA en el CRG enriquece los contenidos de EGA aportando sus conocimientos sobre genómica y la relación entre genomas y fenomas. En Barcelona, los datos del EGA se almacenan en el Barcelona Supercomuting Center - Centro Nacional de Supercomputación (BSC-CNS).


EN CATALÀ

El sistema en el núvol facilita l'intercanvi de dades humans transcontinentals

El projecte CINECA unirà més d'un milió de conjunts de dades humans d'Àfrica, Canadà i Europa.

  • Un nou projecte de col·laboració basat en dades en el núvol fa que les dades -òmiques humanes de més d'un milió de persones siguin accessibles a investigadors autoritzats.
  • L'intercanvi federat de dades serà possible ara en una escala sense precedents a través del projecte CINECA transcontinental
  • Permetre l'accés segur a les dades de recerca clínica ajudarà a accelerar la investigació de malalties, el desenvolupament de medicaments i els descobriments.

 

Els investigadors registrats podran analitzar dades genòmiques i biomoleculars a escala poblacional amb el llançament de la Infraestructura Comuna per Cohorts Nacionals a Europa, Canadà i Àfrica (CINECA), un projecte internacional liderat per l'Institut Europeu de Bioinformàtica (EMBL-EBI) amb participació del Centre de Regulació Genòmica. Una cohort virtual de dades de 1,4 milions d'individus es posarà a disposició d'investigadors aprovats de tot el món a través de la xarxa federada del núvol de CINECA.

L'accés ràpid a les dades d'investigació clínica permet als científics compartir les seves troballes i reduir la necessitat de duplicar estudis costosos. Això accelera la investigació i ajuda a millorar els beneficis per als pacients mitjançant l'intercanvi responsable de dades genètiques, fenotípics i d'estil de vida en una escala sense precedents.

Formada per 18 organitzacions associades en tres continents, CINECA es compon de dades d'11 cohorts seleccionades per a proporcionar una representació diversa d'estudis sobre malalties rares, malalties comunes i cohorts nacionals al llarg del temps (longitudinal).

Medicina personalitzada

En els propers cinc anys es preveu que la majoria dels genomes humans es generaran a través d'iniciatives d'atenció mèdica a escala nacional. Les eines d'anàlisi federades, com les de la iniciativa CINECA, podrien ajudar a identificar tractaments rellevants per als pacients de forma individual i s'espera que, en un futur pròxim, el núvol sigui utilitzat per programes de medicina personalitzada a tot el món.

"En permetre l'accés a dades genètiques de diverses poblacions humanes, CINECA donarà suport al desenvolupament de tractaments a mida del perfil genètic de cada pacient, l'objectiu final de la medicina personalitzada", diu Thomas Keane, cap d'equip a l'EMBL-EBI. "Els metges clínics han de poder comparar el genoma d'un pacient amb un gran conjunt de persones sanes i malaltes, per a comprendre la genètica subjacent del pacient. I per "gran conjunt", volem dir centenars de milers o fins i tot milions d'altres persones ".

Jordi Rambla, cap de l'equip de l'Arxiu Europeu de Genomes i Fenomes (EGA) al Centre de Regulació Genòmica (CRG) de Barcelona, ​​afegeix: "Es tracta de compartir. Com més ampli sigui l'abast de les dades disponibles, més útils seran. Aportarem l'experiència, el coneixement i la capacitat de l’EGA a aquest projecte, de manera que avancem cap a dades genòmiques i biomoleculars més accessibles a través de les fronteres internacionals i sota un marc de recerca harmonitzat per comprendre millor les malalties".

Eines per al descobriment

Un objectiu clau de CINECA és desenvolupar eines que permetin el descobriment ràpid de dades, l'accés segur i l'autorització dins del núvol. Aquestes eines permetran als investigadors descobrir ràpidament dades rellevants per a projectes d'investigació en curs, sense duplicar estudis. Això augmenta el potencial de nous descobriments sobre les causes de malalties rares i comunes, com el càncer o la diabetis.

"El projecte ens proporciona una via per alinear-nos amb les millors pràctiques internacionals i contribuir a elles des d'una perspectiva africana i amb recursos limitats", diu Nicola Mulder, directora de biologia computacional de la universitat de Ciutat del Cap i investigadora principal de la Xarxa de bioinformàtica africana H3ABioNet). "Al mateix temps que contribuïm amb la nostra pròpia experiència en el treball amb diverses dades genètiques d'Àfrica, esperem obtenir experiència en noves tecnologies per a l'intercanvi de dades i implementacions clíniques".

Els reptes

L'intercanvi internacional federat de dades humans planteja reptes ètics i tècnics, els quals constitueixen una tasca integrada dins del projecte CINECA. Oferir una solució que compleixi amb tots els requisits ètics i de seguretat per a l'intercanvi internacional de dades de salut és un objectiu clau del projecte, i proporciona la base sobre la qual CINECA opera.

Per protegir la privacitat del pacient, l'accés a les cohorts de dades federades seguirà l'estructura establerta utilitzada per l'Aliança Global per a la Genòmica i la Salut (GA4GH), on els investigadors han de sol·licitar formalment l'accés a les dades de forma individual. "Aquest projecte és una implementació a gran escala de gairebé tots els estàndards de GA4GH, en particular, l'ús de dades i els estàndards d'identificació de l'investigador", diu Keane. "L'objectiu d'aquesta implementació és accelerar el procés d'accés als conjunts de dades de forma segura. Tot el control dels conjunts de dades roman amb les cohorts locals, ja que no estem tractant de crear un recurs centralitzat, sinó un de federat ".

 

Llistat de socis en aquest projecte:

  • European Molecular Biology Laboratory (EMBL) - Germany
  • IT Center for Science (CSC) - Finland
  • University Applied Sciences Western Switzerland (HES-SO) - Switzerland
  • SIB Swiss Institute of Bioinformatics (SIB) - Switzerland
  • ERASMUS University Medical Centre Rotterdam (EMC) - Netherlands
  • Royal Institution for the Advancement of Learning, McGill University (MCG) - Canada
  • The Hospital for Sick Children (SickKids) - Canada
  • University of Cape Town (UCT) - South Africa
  • National Institute for Health and Medical Research (INSERM) - France
  • University of Tartu (UTARTU) - Estonia
  • Clinicalgeno Limited (Clinicageno) - United Kingdom
  • Centre for Genomic Regulation (CRG) - Spain
  • University Medical Center Groningen (UMCG) - Netherlands
  • The Chancellor, Masters and Scholars of the University of Oxford (UOXF) - United Kingdom
  • Simon Fraser University (SFU) - Canada
  • The Hyve BV (The Hyve) - Netherlands
  • Masaryk University (MU) - Czech Republic
  • Biobank and Biomolecular Resource Research Infrastructure Consortium (BBMRI-ERIC) - Austria

 

Informació sobre finançament: Aquest projecte ha rebut fons del programa de recerca i innovació Horizon 2020 de la Unió Europea en virtut de l'acord de subvenció núm 825775.

Sobre l'Arxiu Europeu de Genomes i Fenomes (EGA) al Centre de Regulació Genòmica (CRG)

L'Arxiu Europeu de Genomes i Fenomes (EGA) és un servei d'arxiu permanent i d'intercanvi de tot tipus de dades genètiques i fenotípiques identificables personalment a partir de projectes de recerca biomèdica. L'EGA conté dades exclusives recopilades d'individus que  autoritzen la cessió de les seves dades només per a un ús específic de recerca. L'EGA proporciona la seguretat necessària per controlar l'accés i mantenir la confidencialitat del pacient, tot proporcionant accés als investigadors i metges autoritzats per veure les dades.

Des del 2014 i gràcies al suport de la Fundació "la Caixa", la Generalitat de Catalunya i el Ministeri d'Economia, Indústria i Competitivitat, el Centre de Regulació Genòmica (CRG) gestiona l'EGA juntament amb l'Institut Europeu de Bioinformàtica ( EMBL-EBI) al Regne Unit. A més de mantenir i distribuir dades, l'equip de l’EGA al CRG enriqueix els continguts de l'EGA aportant els seus coneixements sobre genòmica i la relació entre genomes i fenomes. A Barcelona, ​​les dades de l'EGA s'emmagatzemen al  Barcelona Supercomuting Center - Centre Nacional de Supercomputació ( BSC-CNS).