You are here

    • You are here:
    • Home > Revealing the role of the mysterious small proteins

Revealing the role of the mysterious small proteins

NewsNEWS

22
Feb
Fri, 22/02/2019 - 13:23

Revealing the role of the mysterious small proteins

CRG investigators develop a technique to identify and classify proteins with less than 100 amino acids

EN ESPAÑOL - EN CATALÀ

  • CRG investigators develop a technique to identify and classify proteins with less than 100 amino acids
  • These types of proteins account for only 16% of a bacterial genome’s coding capacity.
  • This technique may be applied to guide the search for new proteins with different functions, such as antimicrobials.

The human genome contains an estimated 20,000 genes coding for proteins. The proteins are the body’s “workers”, tasked with performing specific functions that are key to survival. Despite their importance, there is a type of very small proteins, with less than 100 amino acids, that are essential to understanding how living things work, and about which we know virtually nothing, since merely identifying them is a veritable technological challenge.

Now, however, investigators from the Centre for Genomic Regulation (CRG) of Barcelona, led by the ICREA Research Professor Luis Serrano, head of the Design of Biological Systems group, have developed a technique that can predict and classify these proteins based on a new bioinformatics tool into which they fed multiple -omic data. This enabled them to discover that these small proteins account for at least 16% of the bacterial genome.  The findings of their work have been published in the journal Molecular Systems Biology.

“We studied the Mycoplasma pneumoniae bacteria and discovered that we could be overlooking up to 10 out of every 100 of the proteins coded in their reduced genome simply because they are so small”, said María Lluch-Senar, staff scientist of the CRG and the study’s principal investigator. “This percentage could be highly significant in the case of more complex or human organisms”, she added.

Recent studies have shed some light on the importance of these small proteins, such as the antimicrobial peptides secreted by insects, animals, plants and even human beings in response to infection. These small proteins have also been shown to communicate with other bacteria in the environment and also with the host, such as our organism. In fact, they may play a very important role in having a balanced microbiota.

“The interest of our study lay in ascertaining the number and variety of functions that these hitherto disregarded proteins could present”, explained Samuel Miravet-Verde, a PhD student at the CRG and the lead author of the work.

Hitherto, when a genome was annotated, only DNA segments which following transcription and translation could yield proteins with more than 100 amino acids were taken into account. Anything below this number was disregarded because of the technological challenge involved, since the usual approaches used to identify proteins are not possible precisely because they are so small. This is further complicated by the fact that these proteins tend to have a very short life, they are not abundant or they even present tissue- and time-specific expression patterns that render them even more difficult to detect.

Moreover, comparative conservation studies are normally performed in order to be able to assign functions to proteins, in which different organisms are taken and an attempt is made to ascertain the extent of their presence, compare the length of them both and define whether the similarity between them is or is not significant. As these small proteins cannot be identified, this approach cannot be employed to make comparisons between organisms, whereby their role remains a mystery.

In this research, the investigators conducted a preliminary study in 109 bacterial genomes in which they tried to classify or assign functions to these proteins. To this end, they applied algorithms already used in other settings, into which they input parameters related to the nature of a protein. They subsequently validated their findings by using proteins already identified in other bacterial species.

The technique they developed is universal and may be applied to different bacterial species.

Funding information: Research leading to these results has been supported by the European Research Council (MYCOCHASSIS_670216), ‘Centro de Excelencia Severo Ochoa 2013-2017’, CERCA Program, Government of Catalonia and Spanish Ministry of Economy and Competitiveness (MINECO) for the EMBL partnership, Secretary of Universities and Research, Dept. of Economy and Knowledge, Government of Catalonia (2014SGR678) and ERDF project (Strategic Action in Health 2016, reference CP16/00094) and ‘Platform of Biomolecular and Bioinformatic Resources (ProteoRed)’ (reference PT13/0001), both awarded by the Instituto de Salud Carlos III.

Reference: 
Research in this press release is based on findings published in the following academic paper:
Samuel Miravet-Verde, Tony Ferrar, Guadalupe Espadas-García, Rocco Mazzolini, Anas Gharrab, Eduard Sabido, Luis Serrano & Maria Lluch-Senar (2019). Unraveling the hidden universe of small proteins in bacterial genomes. Molecular Systems Biology 15: e8290. https://doi.org/10.15252/msb.20188290

For more information and interviews, please, contact: Gloria Lligadas, Head of Communications & PR, Centre for Genomic Regulation (CRG) - gloria.lligadas@crg.eu – Tel. +34 933160153 – Mobile +34608550788


EN ESPAÑOL

Desvelando el papel de las misteriosas proteínas pequeñas

  • Investigadores del CRG desarrollan una técnica que permite identificar y clasificar proteínas de menos de 100 aminoácidos
  • Este tipo de proteínas suponen al menos el 16% de la capacidad codificante de un genoma bacteriano.
  • Esta técnica, se podrá aplicar para guiar la búsqueda de nuevas proteínas con diversas funciones, por ejemplo, antimicrobianas.

En el genoma humano se calcula que hay alrededor de unos 20.000 genes que codifican para proteínas. Las proteínas son las ‘obreras’ del organismo, encargadas de realizar funciones concretas clave para la supervivencia. A pesar de su importancia, existe un tipo de proteínas sumamente pequeñas, de menos de 100 aminoácidos, esenciales para entender cómo funcionan los seres vivos, de las que apenas se conoce nada, puesto que identificarlas supone un desafío tecnológico.

Ahora investigadores del Centro de Regulación Genómica (CRG) de Barcelona, liderados por el investigador ICREA Luis Serrano, jefe del Grupo de Diseño de Sistemas Biológicos, han desarrollado una técnica que les permite predecir y clasificar estas proteínas, basada en una nueva herramienta bioinformática que han alimentado con múltiples datos ómicos. Así, han podido ver que estas pequeñas proteínas suponen al menos el 16% del genoma de las bacterias.  Los resultados de su trabajo se recogen en Molecular Systems Biology.

“Hemos estudiado la bacteria Mycoplasma pneumoniae y hemos descubierto que podíamos estar obviando hasta 10 de cada 100 de las proteínas codificadas en su reducido genoma debido al pequeño tamaño de éstas”, afirma María Lluch-Senar, científica asociada del CRG e investigadora principal del estudio. “En el caso de organismos más complejos o humanos, ese porcentaje podría ser muy significativo”, añade.

Estudios recientes han arrojado luz sobre la importancia de estas proteínas pequeñas, como los péptidos antimicrobianos secretados por los insectos, animales, plantas e incluso los humanos en respuesta a una infección. También se ha visto que estas proteínas pequeñas sirven para comunicarse con otras bacterias en el medio y también con el huésped, como por ejemplo nuestro organismo. De hecho, pueden desempeñar un papel muy importante en tener una microbiota equilibrada.

“El interés de nuestro estudio era determinar qué número y variedad de funciones podían presentar estas proteínas que hasta ahora no se habían considerado”, apunta Samuel Miravet-Verde, estudiante de doctorado en el CRG y primer autor del trabajo.

Hasta el momento, al anotar un genoma solo se tenían en cuenta segmentos de ADN que al transcribirse y traducirse podrían originar proteínas mayores de 100 aminoácidos. Por debajo de esa cantidad, se desestimaban porque suponía un desafío tecnológico. Esto es así porque las aproximaciones habituales para identificar proteínas no son posibles, precisamente debido al tamaño tan pequeño de estas. A eso se suma que estas proteínas suelen tener una vida muy corta, están presentes en poca abundancia o incluso muestran patrones de expresión específicos de tejido y temporales que dificulta aún más detectarlas.

Además, para poder asignar funciones a las proteínas se suelen realizar estudios comparativos de conservación, en los que se toman distintos organismos y se intenta ver cómo de presentes están esas proteínas, se compara la longitud de ambas y se define si la similitud entre ellas es o no significativa. Al no poder identificar esas proteínas pequeñas, no se puede utilizar esta aproximación para comparar entre organismos, por lo que el papel que desempeñan es un misterio.

En este trabajo, los investigadores han realizado un estudio preliminar en 109 genomas de bacterias en los que han tratado de clasificar o asignar funciones a estas proteínas. Para ello, han aplicado algoritmos ya existentes en otros ámbitos en los que han introducido parámetros acerca de qué es una proteína. Luego han validado sus resultados usando proteínas identificadas previamente en otras especies bacterianas.

La técnica que han desarrollado es universal y se puede aplicar a distintas especies bacterianas.

Información sobre la financiación de este estudio: La investigación que ha producido estos resultados ha recibido el apoyo del Consejo Europeo de Investigación (MYCOCHASSIS_670216), ‘Centro de Excelencia Severo Ochoa 2013-2017’, Programa CERCA, Generalitat de Catalunya y el Ministerio de Economía y Competitividad (MINECO) para el partnership con el EMBL, “Secretaria d’Universitats i Recerca del Departament d’Economia i Coneixement de la Generalitat de Catalunya” (2014SGR678) y proyecto FEDER (Acción Estratégica en Salud 2016, referencia CP16/00094) y ‘Plataforma de Recursos Biomoleculares y Bioinformáticos (ProteoRed)’ (referencia PT13/0001) ambas concedidas por el Instituto Carlos III.

Referencia:
El estudio descrito en esta nota de prensa está basado en descubrimientos publicados en la siguiente publicación académica:
Samuel Miravet-Verde, Tony Ferrar, Guadalupe Espadas-García, Rocco Mazzolini, Anas Gharrab, Eduard Sabido, Luis Serrano & Maria Lluch-Senar (2019). Unraveling the hidden universe of small proteins in bacterial genomes. Molecular Systems Biology 15: e8290. https://doi.org/10.15252/msb.20188290

Para más información y entrevistas, por favor, contactad a: Gloria Lligadas, Directora de Comunicación y RRPP, Centro de Regulación Genómica (CRG) - gloria.lligadas@crg.eu – Tel. +34 933160153 – Móvil +34608550788


EN CATALÀ

Desvetllant el paper de les misterioses proteïnes petites

  • Investigadors del CRG desenvolupen una tècnica que permet identificar i classificar proteïnes de menys de 100 aminoàcids.
  • Aquest tipus de proteïnes suposen, almenys, el 16% de la capacitat codificant d’un genoma bacterià.
  • Aquesta tècnica es podrà aplicar per guiar la cerca de noves proteïnes amb diverses funcions, como ara, antimicrobianes.

Al genoma humà es calcula que hi ha al voltant d’uns 20.000 gens que codifiquen per proteïnes. Les proteïnes són les ‘obreres’ de l’organisme, encarregades de realitzar funcions concretes clau per a la supervivència. Tot i la seva importància, existeix un tipus de proteïnes extremament petites, de menys de 100 aminoàcids, essencials per comprendre com funcionen els éssers vius, de les quals gairebé no se’n sap res, ja que identificar-les suposa un desafiament tecnològic.

Ara, científics del Centre de Regulació Genòmica (CRG) a Barcelona, liderats pel professor investigador ICREA Luis Serrano, cap del grup de Disseny de Sistemes Biològics, han desenvolupat una tècnica que els permet predir i classificar aquestes proteïnes, basada en una nova eina bioinformàtica que han alimentat amb múltiples dades òmiques. Així, han pogut veure que aquestes petites proteïnes suposen, almenys, el 16% del genoma dels bacteris. Els resultats del seu treball es recullen a la revista Molecular Systems Biology.

“Hem estudiat el bacteri Mycoplasma pneumoniae  i hem descobert que podíem estar obviant fins a 10 de cada 100 de les proteïnes codificades en el seu reduït genoma a causa de les seves petites dimensions”, afirma Maria Lluch-Senar, científica associada del CRG i investigadora principal de l’estudi. “En el cas d’organismes més complexos o humans, aquest percentatge podria ser molt significatiu”, afegeix.

Estudis recents han esclarit la importància d’aquestes proteïnes petites, com ara els pèptids antimicrobians, secretats pels insectes, animals, plantes i fins i tot els humans, en resposta a una infecció. També s’ha vist que aquestes proteïnes petites serveixen per comunicar-se amb d’altres bacteris en el medi i també amb l’hoste, com ara el nostre organisme. De fet, poden dur a terme una funció molt important en tenir una microbiota equilibrada.

“L’interès del nostre estudi era determinar quin número i varietat de funcions podien presentar aquestes proteïnes que fins ara no s’havien tingut en compte”, apunta Samuel Miravet-Verde, estudiant de doctorat al CRG i primer autor del treball.

Fins ara, en anotar un genoma només es tenien en compte segments d’ADN que al transcriure’s i traduir-se podrien originar proteïnes més grans de 100 aminoàcids. Per sota d’aquesta quantitat, es desestimaven perquè suposava un desafiament tecnològic. Això és així perquè les aproximacions habituals per identificar proteïnes no són possibles, precisament a causa de les seves reduïdes dimensions. A aquest fet, se suma que aquestes proteïnes solen tenir una vida molt curta, estan presents en poca abundància i fins i tot mostren patrons d’expressió específics de teixits i temporals que dificulta encara més detectar-les.

A més, per poder assignar funcions a les proteïnes, se solen realitzar estudis comparatius de conservació, en què es prenen diferents organismes i s’intenta veure com de presents són aquestes proteïnes, es compara la longitud d’ambdues i es defineix si la similitud entre elles és o no significativa. En no poder identificar aquestes proteïnes petites, no es pot emprar aquesta aproximació per comparar entre organismes, fet pel qual el paper que desenvolupen és un misteri.

En aquest treball, els investigadors han realitzat un estudi preliminar en 109 genomes de bacteris, en què han tractat de classificar o assignar funcions a aquestes proteïnes. Per fer-ho, han aplicat algoritmes ja existents en d’altres àmbits, en què han afegit paràmetres sobre de què és una proteïna. Després, han validat els seus resultats utilitzant proteïnes identificades prèviament en d’altres espècies bacterianes.

La tècnica que han desenvolupat és universal i es pot aplicar a distintes espècies bacterianes.

Informació sobre el finançament d’aquest estudi: La recerca que ha produït aquests resultats ha rebut el suport del Consell Europeu de Recerca (MYCOCHASSIS_670216), ‘Centro de Excelencia Severo Ochoa 2013-2017’, Programa CERCA, Generalitat de Catalunya i el Ministeri d’Economia i Competitivitat (MINECO) per al partnership amb l’EMBL, “Secretaria d’Universitats i Recerca del Departament d’Economia i Coneixement de la Generalitat de Catalunya” (2014SGR678) i projecte FEDER (Acció Estratègica en Salut 2016, referència CP16/00094) i ‘Plataforma de Recursos Biomoleculars i Bioinformàtics (ProteoRed)’ (referència PT13/0001) ambdues concedides per l’Instituto de Salud Carlos III.

Referència:
L’estudi descrit en aquesta nota de premsa està basat en descobriments publicats en la següent publicació acadèmica:
Samuel Miravet-Verde, Tony Ferrar, Guadalupe Espadas-García, Rocco Mazzolini, Anas Gharrab, Eduard Sabido, Luis Serrano & Maria Lluch-Senar (2019). Unraveling the hidden universe of small proteins in bacterial genomes. Molecular Systems Biology 15: e8290. https://doi.org/10.15252/msb.20188290

Para a més informació i entrevistes, si us plau contacteu a: Glòria Lligadas, Directora de Comunicació i Relacions Públiques, Centre de Regulació Genòmica (CRG) - gloria.lligadas@crg.eu – Tel. +34 93 316 01 53 – Mòbil +34 608 550 788