fbpx

Una nueva técnica para diseñar proteínas

Un enfoque computacional: mejores proteínas.

Para diseñar proteínas con funciones útiles, los investigadores habitualmente comienzan con una proteína natural que tiene una función deseable, como emitir luz fluorescente y la someten a muchas rondas de mutación aleatoria que eventualmente generan una versión optimizada de la proteína. Es de acotar que, este proceso ha producido versiones optimizadas de muchas proteínas importantes, incluida la proteína verde fluorescente (GFP). Sin embargo, es necesario señalar que, para otras proteínas, ha resultado dificultoso generar una versión optimizada. Los investigadores del MIT han desarrollado ahora un enfoque computacional el cual facilita la predicción de mutaciones que conducirán a mejores proteínas, basándose en una cantidad relativamente pequeña de datos. ¡Todos los detalles a continuación!

 

Un enfoque computacional: mejores proteínas

Es crucial señalar que, usando este modelo, los investigadores generaron proteínas con mutaciones que se pronosticó que conducirían a versiones mejoradas de GFP y una proteína del virus adenoasociado (AAV), que se usa para administrar ADN para la terapia génica. Esperan que también pueda usarse para desarrollar herramientas adicionales para la investigación en neurociencia y aplicaciones médicas.

 

Optimización de proteínas

Muchas proteínas naturales poseen funciones que podrían hacerlas útiles para investigación o aplicaciones médicas, sin embargo, precisan un poco de ingeniería adicional para optimizarlas. En este estudio, los investigadores se encontraban inicialmente interesados ​​en desarrollar proteínas que pudieran usarse en células vivas como indicadores de voltaje. Estas proteínas, producidas por algunas bacterias y algas, emiten luz fluorescente cuando se detecta un potencial eléctrico. Si se diseñan para su uso en células de mamíferos, estas proteínas podrían llegar a permitir a los investigadores medir la actividad neuronal sin usar electrodos.

Es de resaltar que, para cualquier proteína determinada que los investigadores desean optimizar, existe un número casi infinito de secuencias posibles que podrían generarse intercambiando diferentes aminoácidos en cada punto de la secuencia. Con tantas variantes posibles, es imposible probarlas todas experimentalmente, por lo que los investigadores han acudido al modelado computacional para intentar predecir cuáles funcionarán mejor.

Vale la pena recalcar que, en este estudio, los investigadores se plantearon superar esos desafíos, usando datos de GFP para desarrollar y probar un modelo computacional que podría pronosticar mejores versiones de la proteína.

Según se informa, empezaron entrenando un tipo de modelo conocido como red neuronal convolucional (CNN) con datos experimentales que consisten en secuencias GFP y su brillo, la característica que querían optimizar.

El modelo consiguió crear un “panorama de aptitud física”, un mapa tridimensional que representa la aptitud de una proteína determinada y en qué medida difiere de la secuencia original, basándose en una cantidad comparativamente pequeña de datos experimentales (de alrededor de 1.000 variantes de GFP).

Según se ha podido conocer, estos paisajes contienen picos que representan proteínas más en forma y valles que simbolizan proteínas menos en forma. Pronosticar el camino que una proteína debe seguir para alcanzar los picos de aptitud puede ser dificultoso, porque a menudo una proteína requerirá sufrir una mutación que la haga menos apta antes de alcanzar un pico cercano de mayor aptitud. Es de acotar que, para superar este problema, los investigadores utilizaron una técnica computacional existente para “suavizar” el panorama del fitness.

Es de aclarar que, una vez que se suavizaron estos pequeños baches en el paisaje, los investigadores volvieron a entrenar el modelo de CNN y descubrieron que podía alcanzar mayores picos de aptitud con mayor facilidad. El modelo fue capaz de predecir secuencias de GFP optimizadas que tenían hasta 7 aminoácidos diferentes de la secuencia de proteínas con la que comenzaron, y se estimó que la mejor de estas proteínas era cerca de 2,5 veces más apta que la original.

Prueba de concepto

No se debe pasar por alto mencionar que, los investigadores también demostraron que este enfoque funcionó bien en la identificación de nuevas secuencias para la cápside viral del virus adenoasociado (AAV), un vector viral que se utiliza generalmente para administrar ADN. En ese caso, optimizaron la cápside por su capacidad de empaquetar una carga útil de ADN.

Según se pudo conocer, los investigadores ahora planean usar esta técnica computacional con datos que Bracha ha estado generando sobre proteínas indicadoras de voltaje.

Deja un comentario