alphafold ejemplo de proteinas

¿Por qué es tan importante la noticia de AlphaFold?

Hace unos días saltó el notición: El sistema AlphaFold del proyecto DeepMind de Google es capaz de predecir la estructura terciaria de las proteínas con una precisión bastante alta. Pese a las grandes implicaciones y el punto de inflexión que puede marcar en la investigación en biología, y en general, en la investigación biomédica parece que no ha tenido apenas relevancia entre el gran público. En este post, vamos a explicar por qué es tan importante esta noticia y tan beneficiosa para todos.

Entendiendo cómo funcionan las proteínas

Las proteínas son secuencias de aminoácidos, es decir, una cadena de diferentes moléculas (aminoácidos) unidas entre sí que es única de cada proteína. Cada una de estas moléculas tiene una composición química diferente y por este motivo tenemos diferentes aminoácidos (alanina, glutamina, lisina, metionina… así hasta un total de 22).

Como decíamos las proteínas tienen diferentes combinaciones de aminoácidos y además, tienen longitudes muy variables. Así, podríamos tener infinitas combinaciones de aminoácidos que conformen proteínas. En el ser humano hay millones de proteínas, se ha estimado en 42 millones según este estudio de publicado en Cell Biology.

Aunque definamos las proteínas como una secuencia de aminoácidos, y esto es algo muy importante, la clave para conocer cómo funciona una proteína es su estructura terciaria, es decir, cómo es en las tres dimensiones una vez ha realizado todo el proceso de alcanzar esa conformación (antes de llegar a la estructura terciaria pasan por una secundaria). El cómo una secuencia de aminoácidos llega a su estructura terciaria es lo que se conoce como plegamiento de las proteínas.

La función que una proteína realiza depende de su estructura terciaria por lo tanto, conocerla es clave para investigar su función y las implicaciones que tenga en cada proceso bioquímico. Si una proteína se pliega incorrectamente deja de desarrollar la función biológica que tiene asignada.

Ejemplos de la importancia de la estructura de las proteínas

La relación entre las proteínas y la enfermedad se da en un gran porcentaje de las mismas. Fallos en el plegamiento de las proteínas suponen enfermedades raras y no tan raras. Conocer la estructura de proteínas clave de agentes patógenos también es importante para desarrollar tratamientos.

Por ejemplo, en el caso más reciente: la covid-19. La proteína S (o spike) de la cápsula del coronavirus es la que se une a los receptores (ACE) de nuestras células. Conocer cómo es la proteína S y su estructura permite desarrollar (o estimar la utilización de fármacos ya existentes) que limiten la unión de los virus a nuestras células y por tanto, su entrada.

Imagen tridimensional de la proteína S del SARS-Cov-2. Autor: National Institute of Allergy and Infectious Diseases (NIAID)

Otra enfermedad igualmente actual pero eclipsada por la pandemia que se debe a errores en el plegamiento de las proteínas es el Alzheimer donde el plegamiento incorrecto del péptido-β-amiloide (Aβ42) provoca las placas amiloides (el péptido correctamente plegado protege del estrés oxidativo, activa quinasas…). La enfermedad de Parkinson, la ELA, y el cáncer son otras enfermedades para las que conocer el plegamiento incorrecto de las proteínas es muy importante.

Hasta aquí espero haber conseguido explicar, por qué es muy importante conocer la estructura terciaria de las proteínas.

Determinar el plegamiento de las proteínas no es nada fácil

Como he explicado en el punto anterior, las secuencias de aminoácidos de las proteínas son muy variables, y especialmente cuando son muy largas, las combinaciones entre la interacción química de los aminoácidos que la componen puede ser de millones de combinaciones según las proteínas.

Para ello, se utilizan diferentes métodos experimentales que son muy caros, y laboriosos: determinar una estructura de una proteína puede llevar meses o incluso años. Por ejemplo, hace poco publicamos cómo una lectora del blog dentro de su tesis doctoral buscaba determinar la estructura de una parte del proteosoma y cómo es algo complicado, laborioso y largo en numerosas ocasiones.

Entre los diferentes métodos pueden utilizarse la cristalografía, utilizar un sincrotrón (acelerador de partículas) que es algo muy caro, o la criomicroscopía electrónica.

El cambio que supone AlphaFold

AlphaFold, el sistema del proyecto de Google Deepmind de acceso libre, predice la estructura terciaria de una secuencia de aminoácidos utilizando Inteligencia Artificial. No es novedoso,  CASP14, ya fue una primera versión experimental del método que ahora utiliza AlphaFold y cuyo cambio fundamental es la precisión en la determinación del proteoma humano.

Actualmente, en las bases de datos de estructura terciaria de proteínas hay aproximadamente 180.000 estructuras determinadas experimentalmente. Si bien las estructuras que predice AlphaFold son teóricas, tienen previsto liberar 100 millones de estructuras de proteínas tanto humanas como de otros organismos clave, con una longitud de hasta 2700 aminoácidos.

Aquí puedes ver cómo funciona AlphaFold con un ejemplo de una proteína de Drosophila melanogaster, el organismo modelo experimental más utilizado para los estudios en genética.

El sistema no es del todo preciso, con un plddt mayor del 70% (plddt es la puntuación que evalúa cómo de bien se reproducen las distancias interatómicas en una estructura de proteína de referencia en una segunda estructura que se compara con ella), se encuentran un 58% de los residuos de aminoácidos y a nivel de proteína es menor. Esto es así porque, al menos de momento, este sistema no contempla el ambiente celular y las interacciones con otras moléculas.

alphafold ejemplo de proteinas

Sin embargo, pese a esta menor precisión el tiempo que puede ahorrar en determinar la estructura de las proteínas es muy grande. En estos momentos, gracias al Proyecto Genoma Humano conocemos la secuencia de casi todas las proteínas del cuerpo humano. Con este proyecto, podemos conocer su estructura acelerando la investigación en un sinfín de enfermedades y en particular, siendo de gran ayuda para las enfermedades raras ya que puede reducir una parte de los costes de la investigación.

G. Costas
Licenciada en Biología con las especialidades ambiental y marina por la Universidad de Alicante.