Por Consuelo Doddoli, Ciencia UNAM-DGDC
Pensamos en las proteínas como unos componentes de los alimentos necesarios para mantenernos sanos. Sin embargo, estas biomoléculas están presentes en todos los seres vivos y desempeñan un papel muy importante en los procesos esenciales para la vida.
Para entender su importancia, imaginemos una sociedad donde alguien dirige y planifica lo que allí sucede, además conoce las instrucciones necesarias para realizar todas las funciones indispensables para que esta sociedad marche sin problema. Esto es el equivalente al ADN que existe en cada una de las células de los seres vivos.
También esta sociedad necesita máquinas y equipo necesario para realizar todas las actividades de la vida cotidiana- casa, coche, cafetera, semáforos, horno de microondas, etc.- pero para fabricar este tipo de máquinas es necesario que exista una infraestructura más grande.
Estas última es el equivalente al ARN, molécula que también se encuentra en las células y que es esencial para convertir la información genética almacenada en el ADN en proteínas.
Las maquinas necesarias para realizar las actividades de la vida cotidiana como la licuadora, el coche, el horno de microondas, es el equivalente a las proteínas, continúa el doctor Rogelio Rodríguez-Sotres, del Departamento de Bioquímica de la Facultad de Química de la UNAM.
Para entender cómo funciona esta sociedad —agrega—y corregir los problemas que se puedan presentar, es necesario entender estas máquinas, es decir, cómo están armadas, cómo son sus partes.
En otras palabras, para entender el funcionamiento de las proteínas, se requiere conocer su estructura, lo que nos permitirá corregir los problemas que surjan que van desde enfermedades hasta el control de plagas.
Todos los seres vivos estamos constituidos por ADN, ARN y proteínas; estas últimas, desempeñan un papel fundamental en los seres vivos.
Existe una cantidad enorme de proteínas en la naturaleza que hacen funciones muy diversas, en particular en el organismo humano existen alrededor de 30,000.
Tenemos proteínas que se encuentran en la membrana celular y que permiten el paso de los nutrientes que la célula requiere y, al mismo tiempo, en esta membrana existen otro tipo de proteínas cuya función es expulsar las sustancias que ya no necesita, así como también, transformar las substancias asimiladas, en aquellas que son indispensables para el funcionamiento del cuerpo.
Por ejemplo, existe un tipo de proteína, conocida como enzima, que degrada los alimentos que ingerimos en elementos más sencillos para que pueden entrar a la célula. Otro conjunto de proteínas convierte los nutrientes de los alimentos en la energía necesaria para realizar todas las funciones de la célula. También los músculos, los órganos y el sistema inmunológico están hechos principalmente de proteínas.
Entender las proteínas para entender la vida
Las proteínas son moléculas grandes y complejas formadas por la unión de 20 moléculas más pequeñas, conocidas como aminoácidos. Los aminoácidos se unen para construir largas cadenas que se pliegan entre sí para formar estructuras tridimensionales de formas muy distintas -esferas, cilindros, anillos, fibras, espirales, las cuales determinan su función; por ejemplo, los anticuerpos que protegen al organismo de patógenos como el coronavirus tienen forma de Y, mientras que la colágena que forma los tendones tiene la forma de cordeles tensados muy tenaces.
Aunque solo existen 20 aminoácidos, estos pueden combinarse de distintas maneras lo que da un número enorme de combinaciones posibles. Para darnos una idea de lo compleja que puede ser la estructura de una proteína, imaginemos que tenemos 20 cajitas en las que ponemos un cierto tipo de aminoácido y luego vamos a armar una proteína, uniendo los aminoácidos que están en las cajitas, en orden.
Entonces tomamos un aminoácido cualquiera de los 20 y lo colocamos en la primera cajita y luego tomamos otro cualquiera, igual o diferente para colocarlo en la segunda cajita y así sucesivamente. Pero en cada elección tengo 20 opciones y si considero mis opciones para llenar las dos primeras cajitas existen 20×20=400 maneras distintas de poder agregar un aminoácido.
Si ahora llenamos la tercera cajita con un tercer aminoácido, a las 400 opciones que ya teníamos, agregaríamos la posibilidad de 20 opciones más, es decir 400×20 = 203 = 8,000 posibilidades distintas, y sólo llevamos tres unidades pegadas. Las proteínas tienen entre 100 y 35,000 aminoácidos pegados, por ejemplo, la proteína de hemoglobina tiene la fórmula de C2952H4664O832S8Fe4. y su secuencia consta de 140 aminoácidos unidos. Por lo tanto, las posibilidades que existen de armar una proteína son enormes, refiere el investigador.
Los científicos tienen otro problema: conocer la forma que tiene cada proteína. «Por ejemplo, si tengo una secuencia de 100 aminoácidos, cada aminoácido es una pieza que se puede torcer en el espacio en al menos 3 formas distintas. Así, puedo torcer el primero y torcer el segundo y el tercero, …, hasta llegar al número 100. En cada paso tengo 3 o más formas para escoger de modo que las formas posibles son 3x3x3…= 3100.
Si tomamos una calculadora científica y hacemos este cálculo me da como resultado (redondeado) 5 × 1047, es decir 5 seguido de 47 ceros. En otras palabras, estas cadenas de aminoácidos se pueden plegar en un número enorme de formas diferentes, pero en la realidad suelen tomar una forma espacial única”.
La forma o plegamiento de una proteína determina su función en los organismos y con un propósito único, es decir, las proteínas con secuencia de aminoácidos distintos tendrán estructuras y funciones diferentes, asegura el investigador.
“Esto es muy importante en diferentes ámbitos de la ciencia, por ejemplo, en la medicina, ya que muchas enfermedades se deben a cambios en la secuencia de aminoácidos, por lo tanto, en la forma de una determinada proteína. Por ejemplo, la fibrosis quística es un trastorno genético que afecta los pulmones y el sistema digestivo; es causada por una mutación en la proteína conocida como CFTR; esta mutación provoca una alteración en su funcionamiento normal y conduce a la enfermedad.”
El reto de conocer la secuencia y la forma de una proteína
En 1959, dos grupos de científicos, liderados uno por el inglés John Kendrew y, el otro, por el austriaco Max Perutz, aplicaron técnicas de difracción de rayos X, logrando conocer, por primera vez, la estructura tridimensional de una proteína: la mioglobina de cachalote y unas semanas después la de la hemoglobina -ambas proteínas involucradas en el transporte de oxígeno en los seres vivos-.
El estudio para determinar la estructura de la hemoglobina había iniciado alrededor de 20 años antes y para lograr su cometido fue necesario que se descubrieran y refinaran distintas técnicas de cristalización, la obtención de datos de alta calidad y resolución con las fuentes de rayos X de la época.
También fue necesario el desarrollo de métodos químicos, matemáticos y computacionales (en las primitivas computadoras de esos años) para producir mapas de densidad electrónica y, finalmente la construcción de los modelos moleculares.
La determinación de la estructura de estas dos proteínas fue posible solo seis años después de que Francis Crick y James D: Watson lograran determinar la estructura del ADN. Ambos descubrimientos sentaron las bases de una nueva área de la ciencia: la Biología Molecular. La trascendencia de estos descubrimientos se vio reconocida cuando los protagonistas de esta historia recibieron el Premio Nobel en 1962.
Uso de Inteligencia Artificial
Actualmente, para conocer la estructura de las proteínas se utilizan varios métodos. Uno de ellos es el de cristalografía por rayos X desarrollado por Kendrew y Perutz. Esta técnica se fue perfeccionando y con la ayuda de computadoras muy poderosas los científicos son capaces de determinar la estructura tridimensional de proteínas, si tienen un modelo inicial de cómo se cree que es esa proteína.
Sin embargo, esta técnica es cara y tiene el inconveniente de que cada proteína requiere de un procedimiento único y, en ocasiones, se pueden tardar varios años en encontrarlo. Además de que no siempre se cuenta con la estructura aproximada de la proteína que se desea estudiar y los datos se quedan sin interpretar.
Para encontrar posibles soluciones al problema de determinar la estructura de las proteínas, algunos investigadores decidieron utilizar algoritmos heurísticos (algoritmos que utilizan reglas generales para encontrar una solución buena, aunque no necesariamente la mejor).
En 1994 se lanzó por primera vez la iniciativa “Evaluación de la calidad de las técnicas para la predicción estructural de proteínas” (CASP por sus siglas en inglés) un experimento mundial que consiste en encontrar el software que prediga la mejor estructura de proteínas a partir de sus secuencias de aminoácidos. El jurado del concurso conoce las estructuras de las proteínas que participan, por lo que las comparan con los resultados que obtienen los distintos participantes y el ganador es el software que se haya obtenido la mejor aproximación.
Este concurso se realiza cada dos años y, desde su inicio, los resultados obtenidos habían venido mejorando poco a poco. Entre esos grupos estaba el de David Baker, que realizó avances importantes, pero acertaba en menos de 30% de sus predicciones. A pesar de sus limitaciones, los programas de Baker eran buenos para ayudar al diseño de proteínas artificiales y en eso tuvieron mucho éxito.
En 2019, se incorporó al concurso un grupo novato liderado por Denis Hassabis, financiado por la empresa DeepMind de Google y usando un algoritmo de inteligencia Artificial llamado AlphaFold. Este grupo solo participó en una categoría pequeña, pero la ganó con bombo y platillo.
Demis era un programador experto ¡pero no sabía de proteínas! Dos años más tarde, en 2021, con la ayuda de John Jumper, experto en proteínas y en programación, el vencedor del concurso fue su algoritmo mejorado de inteligencia artificial conocido como AlphaFold 2.0, desarrollado por la empresa DeepMind de Google, con el que se dio un gran salto, ya que se pasó de predecir de manera aproximada entre un 30 o 40% de las estructuras, a predecir más del 90% de una manera bastante precisa, asegura el especialista. Después de ser galardonados con el premio Nobel de Química 2024, DeepMInd publicó su última versión AlphaFold 3.
Lo que el algoritmo hace es “aprender” aprovechando distintos tipos de información, entre ellas, lo que se conoce como la información evolutiva, es decir, no solo se utiliza la secuencia de aminoácidos que componen la proteína, sino que, además compara esa secuencia con las de todas las proteínas que se parecen y que realizan la misma función biológica.
Por ejemplo, la hemoglobina es una proteína que se encuentra en los humanos, pero también en los gatos, en los perros, en los pájaros, entre otras muchas, y en cada uno de estas especies la secuencia de aminoácidos no es exactamente la misma, pero la estructura y la función sí lo son.
“Esto es equivalente a que en un horno de microondas existen piezas que no se pueden cambiar, por ejemplo, el magnetrón. Pero hay otras, como la puerta, el diseño, etc. que sí se pueden cambiar, no afectan el funcionamiento del horno y que pueden tener ventajas; tal vez el horno sea más pequeño, o más bonito. Esto mismo lo ha hecho la naturaleza, ha cambiado “piezas” en la secuencia de aminoácidos de algunas proteínas, como la hemoglobina, sin que se pierda la función y la estructura.”
El algoritmo AlphaFold 3 analiza las muchas secuencias colectadas, para conocer qué aminoácidos es posible cambiar y cuales deben respetarse en una proteína. También descubre cuales aminoácidos cambian juntos, es decir siempre que cambia el primero el segundo cambia a otro compatible y viceversa.
En el ejemplo del microondas, si quiero cambiar la puerta, también debo poner unos goznes del tamaño y forma que la puedan sujetar. La puerta y los goznes cambian juntos. Con ello se genera un mapa de contactos, esto es, conocer en cada secuencia cómo cada aminoácido que hace contacto con otro; esto permite a la computadora crear la estructura de la proteína de una forma bastante aproximada.
Obtener la estructura de una proteína era un proceso largo y complicado que podía tomar varios años de trabajo. Actualmente con AlphaFold 3 se puede conocer en cuestión de minutos.
El doctor Rogelio Rodríguez-Sotres considera que el conocer más sobre la estructura de las proteínas y la capacidad de predecirlas utilizando la inteligencia artificial nos permitirá desarrollar mejores medicamentos y vacunas, además podremos comprender mejor enfermedades como el cáncer, la demencia y la resistencia a los antibióticos, por mencionar solo algunas ventajas.
- ¿Por qué es importante conocer la estructura de las proteínas? - febrero 26, 2025
- Microplásticos en ríos del Caribe: una preocupación creciente - febrero 26, 2025
- Cuauhtémoc, el último gran gobernante mexica - febrero 24, 2025