NEWS
Generative AI more efficient than nature at designing genome-editing proteins
Professor Marc Guell and the Integra Therapeutics team
Researchers at Integra Therapeutics, in collaboration with the Pompeu Fabra University (UPF) Department of Medicine and Life Sciences (MELIS) and the Centre for Genomic Regulation (CRG), have designed and experimentally validated new synthetic proteins that can edit the human genome more efficiently than proteins provided by nature. This work, a global pioneer published today in the journal Nature Biotechnology, will be of great use in improving the current gene editing tools used in biotechnology research and personalized medicine by developing cellular (CAR-T) and gene therapies, especially to treat cancer and rare diseases.
The ability to insert large DNA sequences into genomes in a safe, targeted manner has been a revolution in the research and development of advanced therapies in recent years. Among the most promising systems are transposases, such as PiggyBac, which copies and pastes DNA to introduce therapeutic genes into patient cells. However, their potential has been limited by the scarce diversity of known transposases and their lack of precision.
The researchers used computational bioprospecting to screen more than 31,000 eukaryotic genomes and discovered more than 13,000 new, previously unknown PiggyBac sequences. After performing experimental validation in cultured human cells, 10 active transposases were identified, demonstrating that there is a large functional diversity that has not yet been explored. Two of these new transposases showed activity comparable to versions already optimized for laboratory and
patient use, and one of them even exhibited high activity in human primary T cells, a crucial cell type for cancer therapies.
In the second phase, researchers went beyond nature and used a protein large language model (pLLM), a form of generative artificial intelligence. They trained the model with the 13,000 PiggyBac sequences discovered to generate completely new sequences with enhanced activity. This approach not only optimized one of the existing transposases, but also demonstrated that AI-engineered variants are compatible with advanced gene editing technologies such as the FiCAT platform.
“Publishing this paper in Nature Biotechnology opens the way to revolutionizing the field of gene editing and advanced therapies and cements Integra Therapeutics’ position at the forefront of gene therapies and the use of innovative tools like AI for protein design in our development,” notes Dr. Avencia Sánchez-Mejías, CEO and co-founder of Integra Therapeutics.
“For the first time, we have used generative AI to create synthetic parts and expand nature. Like the cognitive power of ChatGPT can be used to write a poem, we have used the protein-based large language models to generate new elements that comply with the physical and chemical principles of genes,” explains Dr. Marc Güell, scientific director at Integra Therapeutics and ICREA researcher at MELIS-UPF where he heads up the Translational Synthetic Biology Lab.
“These AI models are trained with all known protein sequences on earth and learn the internal language or ‘grammar’ of proteins. Using this grammar, they are able to speak this language perfectly, generating completely new proteins that maintain structural and functional meaning,” says Dr. Noelia Ferruz, who leads the Artificial Intelligence for Protein Design Group at the CRG.
To accelerate and expand its FiCAT technology and pipeline of therapeutic products, Integra Therapeutics forges strategic partnerships with leading companies and research centers like UPF and CRG.
EN CASTELLANO
La IA generativa es más eficiente que la naturaleza diseñando proteínas para editar el genoma
Investigadores de Integra Therapeutics, en colaboración con el Departamento de Medicina y Ciencias de la Vida (MELIS) de la Universidad Pompeu Fabra (UPF) y el Centro de Regulación Genómica (CRG), han diseñado y validado en el laboratorio nuevas proteínas sintéticas capaces de editar el genoma humano con más eficiencia que las proteínas proporcionadas por la naturaleza. Este trabajo, pionero en todo el mundo y publicado hoy en la revista Nature Biotechnology, será de gran utilidad para mejorar las herramientas de edición genética actuales que se utilizan en la investigación biotecnológica y en la medicina personalizada a través del desarrollo de terapias celulares (CAR-T) y génicas, especialmente, para el tratamiento de enfermedades oncológicas y raras.
La capacidad de insertar grandes secuencias de ADN en genomas de forma específica y segura ha supuesto una revolución en la investigación y el desarrollo de terapias avanzadas en los últimos años. Entre los sistemas más prometedores se encuentran las transposasas, como la PiggyBac, que actúan como copia y pega de ADN para introducir genes terapéuticos en las células del paciente. Sin embargo, su potencial ha estado limitado por la escasa diversidad de transposasas conocidas y su falta de precisión.
Los investigadores utilizaron una metodología de bioprospección computacional para examinar más de 31.000 genomas eucariotas y descubrieron más de 13.000 nuevas secuencias PiggyBac hasta ahora desconocidas. Después de realizar la validación experimental en células humanas en cultivo, se identificaron 10 transposasas activas, lo cual demuestra que existe una gran diversidad funcional que aún no ha sido explorada. Dos de estas transposasas mostraron una actividad
comparable a la de versiones optimizadas para laboratorio y uso en pacientes, y una de ellas exhibió una alta actividad en células T primarias humanas, un tipo celular crucial para terapias oncológicas.
En una segunda fase, los investigadores fueron más allá de la naturaleza y utilizaron un modelo de lenguaje de proteínas (pLLM), una forma de inteligencia artificial generativa. Entrenaron el modelo con las 13.000 secuencias PiggyBac descubiertas para generar secuencias completamente nuevas con actividades mejoradas. Este enfoque no solo optimizó una de las transposasas existentes, sino que también demostró que las variantes diseñadas por la IA son compatibles con tecnologías
avanzadas de edición genética como la plataforma FiCAT de Integra Therapeutics.
“La publicación de este artículo en Nature Biotechnology abre el camino a revolucionar el campo de la edición genética y las terapias avanzadas y consolida la posición de Integra Therapeutics en la vanguardia de las terapias genéticas y el uso de herramientas innovadoras como la aplicación de IA en el diseño de proteínas en nuestro desarrollo” comenta la Dra. Avencia Sánchez-Mejías, CEO y cofundadora de Integra Therapeutics.
"Por primera vez hemos utilizado la IA generativa para crear piezas sintéticas y expandir la naturaleza. De la misma manera que se puede utilizar el poder cognitivo del ChatGPT para escribir un poema, hemos utilizado los modelos de lenguaje extensos basados en proteínas para generar nuevos elementos que cumplen con los principios físico-químicos de los genes” explica el Dr. Marc Güell, investigador ICREA en el MELIS-UPF donde dirige el Laboratorio de Biología Sintética
Translacional y director científico de Integra Therapeutics.
"Estos modelos de IA se entrenan con todas las secuencias de proteínas conocidas en la Tierra y aprenden un lenguaje interno o gramática de las proteínas. A partir de ello, son capaces de hablar este lenguaje a la perfección, generando proteínas completamente nuevas que mantienen sentido estructural y funcional" expone la Dra. Noelia Ferruz, que dirige el Grupo de Diseño de Proteínas con IA en el CRG.
Para acelerar y expandir su tecnología FiCAT y pipeline de productos terapéuticos, Integra Therapeutics establece alianzas estratégicas con empresas y centros de investigación líderes como la UPF y el CRG.
EN CATALÀ
La IA generativa és més eficient que la natura dissenyant proteïnes per editar el genoma
Investigadors d’Integra Therapeutics, en col·laboració del Departament de Medicina i Ciències de la Vida (MELIS) de la Universitat Pompeu Fabra (UPF) i el Centre de Regulació Genòmica (CRG), han dissenyat i validat al laboratori noves proteïnes
sintètiques capaces d'editar el genoma humà amb més eficiència que les proteïnes proporcionades per la natura. Aquest treball, pioner a tot el món i publicat avui a la revista Nature Biotechnology, serà de gran utilitat per millorar les eines d'edició genètica actuals que s'utilitzen en la recerca biotecnològica i en la medicina personalitzada a través del desenvolupament de teràpies cel·lulars (CAR-T) i gèniques, especialment per al tractament de malalties oncològiques i rares.
La capacitat d'inserir grans seqüències d'ADN en genomes de manera específica i segura ha suposat una revolució en la recerca i el desenvolupament de teràpies avançades els darrers anys. Entre els sistemes més prometedors hi ha les transposases, com la PiggyBac, que actuen com a còpia i enganxa d’ADN per introduir gens terapèutics a les cèl·lules del pacient. Tot i això, el seu potencial ha estat limitat per l'escassa diversitat de transposases conegudes i la seva falta de
precisió.
Els investigadors han utilitzat una metodologia de bioprospecció computacional per examinar més de 31.000 genomes eucariotes i han trobat més de 13.000 noves seqüències PiggyBac fins ara desconegudes. Després de dur a terme la validació experimental en cèl·lules humanes en cultiu, es van identificar 10 transposases actives, que demostra que hi ha una gran diversitat funcional que encara no ha estat explorada. Dues d'aquestes transposases van mostrar una activitat comparable
a la de versions optimitzades per a laboratori i ús en pacients, i una va exhibir una alta activitat en cèl·lules T primàries humanes, un tipus cel·lular clau per a teràpies oncològiques.
En una segona fase, els investigadors van anar més enllà de la natura i van fer servir un model de llenguatge de proteïnes (pLLM), una forma d’IA generativa. Van entrenar el model amb les 13.000 seqüències PiggyBac descobertes per generar seqüències completament noves amb activitats millorades. Aquest enfocament no només va optimitzar una de les transposases existents, sinó que també va demostrar que les variants dissenyades per la IA són compatibles amb tecnologies
avançades d'edició genètica com ara la plataforma FiCAT d'Integra Therapeutics.
“La publicació d'aquest article a Nature Biotechnology obre el camí a revolucionar el camp de l'edició genètica i les teràpies avançades i consolida la posició d'Integra Therapeutics a l'avantguarda de les teràpies genètiques i l'ús d'eines innovadores com l'aplicació d'IA en el disseny de proteïnes en el nostre desenvolupament” comenta la Dra. Avencia Therapeutics, CEO i cofundadora d’Integra Therapeutics.
“Per primera vegada hem utilitzat la IA generativa per crear peces sintètiques i expandir la natura. De la mateixa manera que es pot utilitzar el poder cognitiu del ChatGPT per escriure un poema, hem utilitzat els models de llenguatge extensos basats en proteïnes per generar nous elements que compleixen amb els principis fisicoquímics dels gens” explica el Dr. Marc Güell, investigador ICREA al MELIS-UPF on dirigeix el Laboratori de Biologia Sintètica Translacional i director científic d'Integra
Therapeutics.
“Aquests models d'IA s'entrenen amb totes les seqüències de proteïnes conegudes a la Terra i aprenen un llenguatge intern o gramàtica de les proteïnes. A partir d'això, són capaços de parlar aquest llenguatge a la perfecció, generant proteïnes completament noves que mantenen sentit estructural i funcional” exposa la Dra. Noelia Ferruz, que dirigeix el Grup de Disseny de Proteïnes amb IA al CRG.
Per accelerar i expandir la seva tecnologia FiCAT i el pipeline de productes terapèutics, Integra Therapeutics estableix aliances estratègiques amb empreses i centres de recerca líders com la UPF i el CRG.