Se encuentra usted aquí

One billion-year-old rules of protein stability revealed

NewsNOTICIAS

24
Jul
Jue, 24/07/2025 - 20:00

One billion-year-old rules of protein stability revealed

Proteins are life’s molecular workhorses, doing everything from turning sunlight into food to fighting viruses. They are built from 20 different types of amino acid molecules, so even a small protein made of 60 amino acids in length can, in theory, be constructed in a quinquavigintillion, or 10⁷⁸, different ways. That’s about as many atoms there are in the entire universe.

How did evolution choose the handful of amino acid combinations that result in proteins which fold, stay stable and get the job done? And can we learn these rules to help protein engineers design better medicines and greener catalysts? A study published today in the journal Science has taken an important step toward answering both questions.

Proteins have a core that keeps the structure from collapsing, while the surface does most of the work, such as binding with other molecules. For decades, biologists assumed that altering the core was like removing a load-bearing wall: one wrong move and the whole structure collapses. Because buried amino acids are packed tightly, it seemed logical that any alteration can force neighbouring amino acids to shift, resulting in unpredictable domino effects that ripple throughout the protein.

With this classical picture of protein stability, most changes to the building blocks of a protein would set off hidden booby traps and threaten to knock the entire structure out of shape. Given the sheer number of combinations possible, the odds of evolution stumbling onto a safe route to create new proteins seems very small.

The study turns this idea on its head. Researchers at the Centre for Genomic Regulation (CRG) in Barcelona and the Wellcome Sanger Institute in Hinxton, UK, studied a human protein domain (the functional bit of a protein) called FYN-SH3, making hundreds of thousands of variants and testing which ones still folded and worked.

The experiments revealed that SH3 retained its shape and function across thousands of different core and surface combinations. Only a few true, load-bearing amino acids existed in the protein’s core.

“Our data challenges the dogma of proteins being a delicate house of cards. The physical rules governing their stability is more like Lego than Jenga, where a change to one brick threatening to bring the entire structure down is a rare, and crucially, predictable phenomenon,” explains Dr. Albert Escobedo, first author of the study and postdoctoral researcher at the Centre for Genomic Regulation.

The team used the large amount of data generated by their experiments to test whether learning the rules from one protein could help explain the evolution of all related proteins that exist in Nature. They fed the data into a machine-learning algorithm, which helped them create a tool that can predict whether an SH3 sequence will stay stable.

SH3 domains have been diversifying since early multicellular life, roughly one billion years ago. The researchers compared their model against 51,159 natural SH3 sequences found in public databases spanning the entire tree of life, including bacteria, plants, insects and humans. The algorithm correctly flagged almost all SH3 domains as stable, even when a test sequence shared less than a quarter of the sequence with the human version.

“Evolution didn’t have to sift through an entire universe of sequences. Instead, the biochemical laws of folding create a vast, forgiving landscape for natural selection,” says Dr. Escobedo.

The field of protein engineering currently relies on companies screening thousands of protein variants with minimal changes, inching forward a few changes at a time and making the design of new enzymes, drugs and vaccines slow and expensive.

The confirmation that protein stability follows simpler rules than previously thought can slash the trial-and-error phase for protein design, saving significant time and effort for developing proteins with medical or industrial applications, such as greener catalysts or longer-lasting medicines.
  
For example, therapeutic enzymes often fail because their surfaces trigger immune flare-ups. Resurfacing these proteins is labour intensive, requiring lots of trial and error to avoid the scaffold from collapsing and sabotaging a promising design. Now, protein engineers can propose bolder designs, including dozens of simultaneous changes, on computers and walk into the lab already knowing which variants are most likely to survive both folding and functional tests.

“The ability to predict and model protein evolution opens the door to designing biology at industrial speed, challenging the conservative pacing of protein engineering,” explains ICREA Research Professor Ben Lehner, corresponding author of the study with dual affiliation at the Centre for Genomic Regulation (CRG) and the Wellcome Sanger Institute.

EN CASTELLANO

Las reglas de mil millones de años que rigen la estabilidad de las proteínas 

Las proteínas son moléculas muy trabajadoras, que hacen de todo: desde convertir la luz solar en comida hasta combatir los virus. Están construidas a partir de 20 tipos diferentes de moléculas de aminoácidos, por lo que incluso una pequeña proteína de 60 aminoácidos de longitud puede, en teoría, construirse en un tredecillón, o 10⁷⁸, de diferentes maneras. Eso es casi la misma cantidad de átomos que hay en todo el universo.

¿Cómo eligió la evolución el puñado de combinaciones de aminoácidos que permite que las proteínas se plieguen, se mantengan estables y hagan su trabajo? ¿Y podemos aprender estas reglas para ayudar a los/as ingenieros/as de proteínas a diseñar mejores fármacos o catalizadores más ecológicos? Un estudio publicado hoy en la revista Science ha dado un paso importante para responder a ambas preguntas.

Las proteínas tienen un núcleo que evita que la estructura colapse, mientras que la superficie hace la mayor parte del trabajo. Durante décadas, los biólogos asumieron que alterar el núcleo era como quitar un muro de carga: un movimiento en falso y toda la estructura se derrumba. Debido a que los aminoácidos enterrados están empaquetados herméticamente, parecía lógico que cualquier alteración pudiera obligar a los aminoácidos vecinos a cambiar, lo que resultaría en un efecto dominó impredecible que se extendería por toda la proteína.

Con esta imagen clásica de la estabilidad de la proteína, la mayoría de los cambios en los componentes básicos de una proteína activarían trampas ocultas y amenazarían con deformar toda la estructura. Dado el gran número de combinaciones posibles, las probabilidades de que la evolución encontrara una ruta segura para crear nuevas proteínas parecían muy escasas.

El estudio le da la vuelta a esta idea. Un equipo del Centro de Regulación Genómica (CRG) de Barcelona y del Instituto Wellcome Sanger de Hinxton, Reino Unido, estudió un dominio proteico humano (la parte funcional de una proteína) llamado FYN-SH3, creando cientos de miles de variantes y probando cuáles seguían plegadas y funcionaban. 
Los experimentos revelaron que SH3 conservó su forma y función en miles de combinaciones diferentes de núcleo y superficie. Solo existían unos pocos aminoácidos verdaderos, o ‘muros de carga’, en el núcleo de la proteína.

"Nuestros datos desafían el dogma de que las proteínas son un delicado castillo de naipes. Las reglas físicas que gobiernan su estabilidad se parecen más a las de Lego que a las de Jenga. El hecho que cambiar un ladrillo amenace con derribar toda la estructura es un fenómeno raro y, lo que es más importante, predecible", explica el Dr. Albert Escobedo, primer autor del estudio e investigador postdoctoral en el Centro de Regulación Genómica.

El equipo utilizó la gran cantidad de datos generados por sus experimentos para probar si comprender las reglas de estabilidad de una proteína podría ayudar a explicar la evolución de todas las proteínas relacionadas que existen en la naturaleza. Introdujeron los datos en un algoritmo de aprendizaje automático, que les ayudó a crear una herramienta que puede predecir si una secuencia SH3 se mantendrá estable.

Los dominios SH3 se han diversificado desde los inicios de la vida multicelular, hace aproximadamente mil millones de años. El equipo comparó su modelo con 51.159 secuencias naturales de SH3 encontradas en bases de datos públicas que abarcan todo el árbol de la vida, incluidas las bacterias, plantas, insectos y humanos. El algoritmo marcó correctamente casi todos los dominios SH3 como estables, incluso cuando una secuencia de prueba compartía menos de una cuarta parte de la secuencia con la versión humana.

"La evolución no tuvo que escudriñar todo un universo de secuencias. En cambio, las leyes bioquímicas del plegamiento crean un paisaje vasto y tolerante para la selección natural", dice el Dr. Escobedo. 

En la actualidad, el campo de la ingeniería de proteínas depende de empresas que examinan miles de variantes de proteínas con cambios mínimos, avanzando poco a poco y haciendo que el diseño de nuevas enzimas, fármacos y vacunas sea lento y caro.

La confirmación que indica que la estabilidad de las proteínas sigue reglas más simples de lo que se creía puede reducir la fase de prueba y error para el diseño de proteínas, ahorrando mucho tiempo y esfuerzo para desarrollar proteínas con aplicaciones médicas o industriales, como catalizadores más ecológicos o medicamentos más duraderos.  
Por ejemplo, las enzimas terapéuticas a menudo fallan porque sus superficies desencadenan brotes inmunológicos. Alterar la superficie de estas proteínas requiere mucha mano de obra y mucho ensayo y error para evitar que la estructura colapse y sabotee un diseño prometedor.

Ahora, los/as ingenieros/as de proteínas pueden proponer diseños más audaces, incluyendo docenas de cambios simultáneos en computadoras y entrar en el laboratorio sabiendo de antemano qué variantes tienen más probabilidades de sobrevivir, tanto a las pruebas de plegamiento como a las funcionales.

"La capacidad de predecir y modelar la evolución de las proteínas abre la puerta al diseño de la biología a velocidad industrial, desafiando el ritmo conservador de la ingeniería de proteínas", explica el Profesor de Investigación ICREA Ben Lehner, autor correspondiente del estudio con doble afiliación en el Centro de Regulación Genómica (CRG) y el Instituto Wellcome Sanger.

EN CATALÀ

Les regles de mil milions d'anys que regeixen l'estabilitat de les proteïnes

Les proteïnes són molècules molt treballadores, que fan de tot: des de convertir la llum solar en menjar fins a combatre els virus. Estan construïdes a partir de 20 tipus diferents de molècules d'aminoàcids, fet pel qual, fins i tot una petita proteïna de 60 aminoàcids de longitud pot, en teoria, construir-se en un tredecilió, o 10⁷⁸, de diferents maneres. Això és gairebé la mateixa quantitat d'àtoms que hi ha a tot l'univers.

Com va triar l'evolució el grapat de combinacions d'aminoàcids que permet que les proteïnes es pleguin, es mantinguin estables i facin la seva feina? I podem aprendre aquestes regles per ajudar els/les enginyers/es de proteïnes a dissenyar millors fàrmacs  o catalitzadors més ecològics? Un estudi publicat avui a la revista Science ha fet un pas important per respondre a ambdues preguntes.

Les proteïnes tenen un nucli que evita que l'estructura col·lapsi, mentre que la superfície fa la major part de la feina. Durant dècades, els biòlegs van assumir que alterar el nucli era com treure un mur de càrrega: un moviment en fals i tota l'estructura s'ensorra. Atès que els aminoàcids enterrats estan empaquetats hermèticament, semblava lògic que qualsevol alteració pogués obligar els aminoàcids veïns a canviar, la qual cosa resultaria en un efecte dominó impredictible que s'estendria per tota la proteïna.

Amb aquesta imatge clàssica de l'estabilitat de la proteïna, la majoria dels canvis en els components bàsics d'una proteïna activarien trampes ocultes i amenaçarien de deformar tota l'estructura. Atès el gran nombre de combinacions possibles, les probabilitats que l'evolució trobés una ruta segura per crear noves proteïnes semblaven molt escasses.

L'estudi li dona la volta a aquesta idea. Un equip del Centre de Regulació Genòmica (CRG) de Barcelona i de l'Institut Wellcome Sanger de Hinxton, Regne Unit, estudià un domini proteic humà (la part funcional d'una proteïna) anomenat FYN-SH3, creant centenars de milers de variants i provant quines seguien plegades i funcionaven.

Els experiments van revelar que SH3 va conservar la seva forma i funció en milers de combinacions diferents de nucli i superfície. Només existien uns pocs aminoàcids veritables, o 'murs de càrrega', al nucli de la proteïna.

"Les nostres dades desafien el dogma que les proteïnes són un delicat castell de cartes. Les regles físiques que governen la seva estabilitat s'assemblen més a les de Lego que a les de Jenga. El fet que canviar un maó amenaci amb enderrocar tota l'estructura és un fenomen rar i, el que és més important, predictible", explica el Dr. Albert Escobedo, primer autor de l'estudi i investigador postdoctoral al Centre de Regulació Genòmica.

L'equip va utilitzar la gran quantitat de dades generades pels seus experiments per provar si comprendre les regles d'estabilitat d'una proteïna podria ajudar a explicar l'evolució de totes les proteïnes relacionades que hi ha a la natura. Van introduir les dades en un algoritme d'aprenentatge automàtic, que els va ajudar a crear una eina que pot predir si una seqüència SH3 es mantindrà estable.

Els dominis SH3 s'han diversificat des dels inicis de la vida multicel·lular, fa aproximadament mil milions d'anys. L'equip va comparar el seu model amb 51.159 seqüències naturals de SH3 trobades en bases de dades públiques que abasten tot l'arbre de la vida, inclosos els bacteris, plantes, insectes i humans. L'algoritme va marcar correctament gairebé tots els dominis SH3 com a estables, fins i tot quan una seqüència de prova compartia menys d'una quarta part de la seqüència amb la versió humana.

"L'evolució no va haver de buscar en tot un univers de seqüències. En canvi, les lleis bioquímiques del plegament creen un paisatge vast i tolerant per a la selecció natural", diu el Dr. Escobedo.

En l'actualitat, el camp de l'enginyeria de proteïnes depèn d'empreses que examinen milers de variants de proteïnes amb canvis mínims, avançant a poc a poc i fent que el disseny de nous enzims, fàrmacs i vacunes sigui lent i car.

La confirmació que indica que l'estabilitat de les proteïnes segueix regles més simples del que es creia pot reduir la fase de prova i error per al disseny de proteïnes, estalviant molt de temps i esforç per desenvolupar proteïnes amb aplicacions mèdiques o industrials, com catalitzadors més ecològics o medicaments més duradors. 

Per exemple, els enzims terapèutics sovint fallen perquè les seves superfícies desencadenen brots immunològics. Alterar la superfície d'aquestes proteïnes requereix molta mà d'obra i molt assaig i error per evitar que l'estructura col·lapsi i sabotegi un disseny prometedor.

Ara, els/les enginyers/es de proteïnes poden proposar dissenys més audaços, incloent dotzenes de canvis simultanis en computadores i entrar al laboratori sabent per endavant quines variants tenen més probabilitats de sobreviure, tant a les proves de plegament com a les funcionals.

"La capacitat de predir i modelar l'evolució de les proteïnes obre la porta al disseny de la biologia a velocitat industrial, desafiant el ritme conservador de l'enginyeria de proteïnes", explica el Professor d’Investigació ICREA Ben Lehner, autor corresponent de l'estudi amb doble afiliació al Centre de Regulació Genòmica (CRG) i l'Institut Wellcome Sanger.