You are here

    • You are here:
    • Home > Research > How can scientists avoid comparing apples to oranges when sequencing genomes?

How can scientists avoid comparing apples to oranges when sequencing genomes?

NewsNEWS

07
Oct
Wed, 07/10/2020 - 11:00

How can scientists avoid comparing apples to oranges when sequencing genomes?

Ivo Gut

EN ESPAÑOL | EN CATALÀ

Cancer is a disease caused by mutations that make cells lose their capacity to function normally and regulate their growth. Each tumour arises from specific mutations across distinct genomic regions. Scientists identify this genetic variation by comparing the genome of normal cells to the genome of cancer cells. This helps scientists and doctors identify the mutations that are causing the cancer. Some cancer variants allow different treatment, some more effective than others.

Sequencing techniques are expensive and patient samples are not easy to obtain. In the past few years, scientists have been working in large international consortiums such as the Pan-Cancer Analysis of Whole Genomes (PCAWG) to analyse cancer from different patients around the world and build a reference for 38 different types of tumours.

The data generated by PCAWG consisted of almost 3000 normal-cancer genome pairs sequenced at 18 different research institutions. Researchers collected vast amounts of data in just five years, during which methods evolved rapidly. As they did this, they realised that they had been using different sequencing protocols and quality control criteria. This made it difficult to compare each samples’ genomic content, limiting the extent of conclusions researchers could draw from the data.

Researchers from the Centro Nacional de Análisis Genómico (CNAG-CRG), part of the Centre for Genomic Regulation in Barcelona led the development of a method to smooth the differences emerging from samples’ origin and production, helping researchers assess the quality of the samples before analysing their genomic content. Their findings are published in Nature Communications. According to this method, scientists assess five parameters of each normal-cancer genome pair to rate them according to their quality.

“If we compare different M-size cotton t-shirts produced by different clothes brands, the differences in patterns or the materials used to make them will result in a kaleidoscope of the quality of the final product,” says Ivo Gut, principal investigator and last author of the study. “This makes them incomparable and, maybe, the poor quality ones will not meet the standards required to enter in the market. The same can be said about genome sequencing.”

The developed framework is highly valuable because it discriminates low quality results and avoids drawing false conclusions based on lower scoring genomes or masking relevant results.  The exclusion of low quality samples provided by this method enables the use of sequencing data provided by different institutions to maximize the number of data included in each genomic study.  

“To avoid comparing apples to oranges, tools like ours are crucial to aid large, ambitious international efforts such as the 1+Million Genomes project, which will lay the foundation for sharing cancer genome sequencing data across Europe”, concludes Ivo Gut. “This is just one of many quality control frameworks we must establish. The analysis of exomes or genomes for the identification of variants causing rare diseases are to be tackled next.”      

Europe is pursuing the ambitious goal of sequencing at least 1 million human genomes by 2022. This will improve the health of EU citizens by providing new insights into diseases of genetic origin such as cancer and various types of rare diseases.

ABOUT THE CRG

The Centre for Genomic Regulation (CRG) is an international biomedical research institute of excellence, based in Barcelona. The mission of the CRG is to discover and advance knowledge for the benefit of society, public health and economic prosperity. Its interdisciplinary scientific team (over 400 scientists) is focused on understanding the complexity of life from the genome to the cell to a whole organism and its interaction with the environment. The CRG is part of The Barcelona Institute of Science and Technology (BIST) and it is a CERCA centre from the Government of Catalonia.

EN ESPAÑOL

¿Cómo pueden los científicos evitar comparar manzanas con naranjas al secuenciar genomas?

El cáncer es una enfermedad causada por mutaciones que hacen que las células pierdan su capacidad para funcionar normalmente y regular su crecimiento. Cada tumor surge de mutaciones específicas en distintas regiones genómicas. Los científicos identifican esta variación genética comparando el genoma de las células normales con el genoma de las células cancerosas. Esto ayuda a los científicos y médicos a identificar las mutaciones que están causando el cáncer. Algunas variantes de cáncer permiten diferentes tratamientos, algunos más efectivos que otros.

Las técnicas de secuenciación son caras y las muestras de los pacientes no son fáciles de obtener. En los últimos años, los científicos han estado trabajando en grandes consorcios internacionales como el Pan-Cancer Analysis of Whole Genomes (PCAWG) para analizar el cáncer de diferentes pacientes en todo el mundo y construir una referencia para 38 tipos diferentes de tumores.

Los datos generados por el PCAWG consisten en casi 3000 pares de genomas de cáncer normal secuenciados en 18 centros de investigación diferentes. Los investigadores recopilaron grandes cantidades de datos en solo cinco años, durante los cuales los métodos evolucionaron rápidamente. Al hacerlo, se dieron cuenta de que habían estado utilizando diferentes protocolos de secuenciación y criterios de control de calidad. Esto hizo que fuera difícil comparar el contenido genómico de cada muestra, lo que limitaba el alcance de las conclusiones que los investigadores podían sacar de los datos.

Investigadores del Centro Nacional de Análisis Genómico (CNAG-CRG), parte del Centro de Regulación Genómica de Barcelona, lideraron el desarrollo de un método para suavizar las diferencias que surgen del origen y la producción de las muestras, ayudando a los investigadores a evaluar la calidad de las muestras antes de analizar su contenido genómico. Sus hallazgos se publican en Nature Communications. De acuerdo con este método, los científicos evalúan cinco parámetros de cada par de genomas de cáncer normal para calificarlos de acuerdo con su calidad.

"Si comparamos diferentes camisetas de algodón de tamaño M producidas por diferentes marcas de ropa, las diferencias en los patrones o en los materiales utilizados para hacerlas darán como resultado un caleidoscopio de la calidad del producto final", dice Ivo Gut, investigador principal y último autor del estudio. “Esto los hace incomparables y, quizás, los de mala calidad no cumplan con los estándares requeridos para entrar en el mercado. Lo mismo puede decirse de la secuenciación del genoma ".

El marco desarrollado es muy valioso porque discrimina resultados de baja calidad y evita sacar conclusiones falsas basadas en genomas de puntuación más baja o enmascarar resultados relevantes. La exclusión de muestras de baja calidad permite el uso de datos de secuenciación proporcionados por diferentes instituciones para maximizar el número de datos incluidos en cada estudio genómico.

“Para evitar comparar manzanas con naranjas, herramientas como la nuestra son cruciales ya que ayudan a iniciativas internacionales grandes y ambiciosas como el proyecto 1 + Million Genomes, que sentará las bases para compartir datos de secuenciación del genoma del cáncer en Europa”, concluye Ivo Gut. “Este es solo uno de los muchos marcos de control de calidad que debemos establecer. A continuación, se abordará el análisis de exomas o genomas para la identificación de variantes que causan enfermedades raras “.

Europa persigue el objetivo de secuenciar al menos 1 millón de genomas humanos para 2022. Esto mejorará la salud de los ciudadanos de la UE al proporcionar nuevos conocimientos sobre enfermedades de origen genético como el cáncer y varios tipos de enfermedades raras.

SOBRE EL CRG

El Centro de Regulación Genómica (CRG) es un centro internacional de investigación biomédica de excelencia, ubicado en Barcelona. Su misión es descubrir y promover el conocimiento en beneficio de la sociedad, la salud pública y la prosperidad económica. Su equipo científico interdisciplinar (de más de 400 miembros) está centrado en comprender la complejidad de la vida, desde el genoma hasta la célula y un organismo completo, y su interacción con el entorno. El CRG forma parte de The Barcelona Institute of Science and Technology (BIST) y es un centro CERCA de la Generalitat de Catalunya.

EN CATALÀ

Com poden els científics evitar comparar pomes amb peres al seqüenciar genomes?

El càncer és una malaltia causada per mutacions que fan que les cèl·lules perdin la seva capacitat per funcionar normalment i regular el seu creixement. Cada tumor sorgeix de mutacions específiques a diferents regions genòmiques. Els científics identifiquen aquesta variació genètica comparant el genoma de les cèl·lules normals amb el genoma de les cèl·lules canceroses. Això ajuda als científics i metges a identificar les mutacions que causen el càncer. Algunes variants de càncer permeten diferents tractaments, alguns més efectius que d’altres.

Les tècniques de seqüenciació són cares i les mostres dels pacients no són fàcils d’obtenir. Els últims anys, els científics han estat treballant en grans consorcis internacionals com el Pan-Cancer Analysis of Whole Genomes (PCAWG) per a analitzar el càncer de diferents pacients a tot el món i construir una referència per a 38 tipus diferents de tumors.

Les dades generades pel PCAWG consisteixen en quasi 3000 parells de genomes de càncer normal seqüenciats a 18 centres de recerca diferents. Els investigadors van recopilar grans quantitats de dades en només cinc anys, durant els quals els mètodes van evolucionar ràpidament. Es van adonar que havien estat fent servir diferents protocols de seqüenciació i criteris de control de qualitat. Això va fer complicat comparar el contingut genòmic de cada mostra, el que limitava l’abast de les conclusions que els investigadors podien treure de les dades.

Investigadors del Centre Nacional d’Anàlisi Genòmica (CNAG-CRG), part del Centre de Regulació Genòmica de Barcelona, han liderat el desenvolupament d’un mètode per suavitzar les diferències que sorgeixen de l’origen i la producció de les mostres, ajudant als investigadors a avaluar la qualitat de les mostres abans d’analitzar el seu contingut genòmic. Les seves troballes es publiquen a Nature Communications. D’acord amb aquest mètode, els científics avaluen cinc paràmetres de cada parell de genomes de càncer normal per qualificar-los d’acord amb la seva qualitat.

"Si comparem diferents samarretes de cotó de mida M produïdes per diferents marques de roba, les diferències en els patrons o en els materials emprats per fer-les donaran com a resultat un calidoscopi de la qualitat del producte final", diu Ivo Gut, investigador principal de l’estudi. “Això els fa incomparables i, potser, els de mala qualitat no compleixin amb els estàndards requerits per a entrar al mercat. Es pot dir el mateix de la seqüenciació del genoma".

El marc desenvolupat és molt valuós perquè discrimina resultats de baixa qualitat i evita treure falses conclusions basades en genomes de puntuació més baixa o emmascarar resultats rellevants. L’exclusió de mostres de baixa qualitat permet utilitzar dades de seqüenciació proporcionades per les diferents institucions per maximitzar el nombre de dades incloses a cada estudi genòmic.

“Per evitar comparar pomes amb peres, eines com la nostra són essencials, ja que ajuden a iniciatives internacionals grans i ambicioses com el projecte 1 + Million Genomes, que fixarà les bases per a compartir dades de seqüenciació del genoma del càncer a Europa”, conclou Ivo Gut. “Aquest és només un dels molts marcs de control de qualitat que hem d’establir. A continuació, s’abordarà l’anàlisi d’exomes o genomes per a la identificació de variants que causen malalties rares“.

Europa persegueix l’objectiu de seqüenciar almenys 1 milió de genomes humans per al 2022. Això millorarà la salut de la ciutadania de la UE proporcionant nous coneixements sobre malalties d’origen genètic com el càncer i diversos tipus de malalties rares.

SOBRE EL CRG

El Centre de Regulació Genòmica (CRG) és un institut internacional de recerca biomèdica d’excel·lència, ubicat a Barcelona. La seva missió és descobrir i promoure el coneixement en benefici de la societat, la salut pública i la prosperitat econòmica. El seu equip científic interdisciplinari (de més de 400 membres) se centra en comprendre la complexitat de la vida, des del genoma fins a la cèl·lula i un organisme complet, i la seva interacció amb l’entorn. El CRG forma part de The Barcelona Institute of Science and Technology (BIST) i és un centre CERCA de la Generalitat de Catalunya.