Una guia sobre mètodes i programes de predicció d’estructures de proteïnes

Per exercir les seves funcions biològiques, les proteïnes es repleguen en una o més conformacions específiques, dictades per interaccions no covalents complexes i reversibles. Es pot determinar l'estructura d'una proteïna mitjançant tècniques que requereixen temps i són relativament costoses com ara la cristal·lografia, l'espectroscòpia de ressonància nuclear-magnètica i la interferometria de doble polarització. S'han desenvolupat programes de bioinformàtica per calcular i predir estructures de proteïnes basades en les seves seqüències d'aminoàcids.

Una recapitulació de l'estructura de proteïnes

Com a alternativa a la tècnica experimental, les eines d’anàlisi i predicció d’estructures ajuden a predir l’estructura de proteïnes d’acord amb les seves seqüències d’aminoàcids. Resoldre l'estructura d'una proteïna determinada és molt important en medicina (per exemple, en disseny de fàrmacs) i biotecnologia (per exemple, en disseny de nous enzims). El camp de la predicció de proteïnes computacionals està evolucionant constantment, després de l'augment de la potència computacional de les màquines i del desenvolupament d'algorismes intel·ligents.

Hi ha quatre nivells d’estructura de proteïnes (figura 1). En la predicció d’estructures proteïnes, l’estructura primària s’utilitza per predir estructures secundàries i terciàries.

Les estructures secundàries de les proteïnes es localitzen plegant dins de la cadena polipeptídica que s’estabilitza mitjançant enllaços d’hidrogen. Les estructures de proteïnes secundàries més comunes són els helicòpters alfa i els fulls beta.

L’estructura terciària és la forma final de la proteïna un cop les diferents estructures secundàries s’han plegat en una estructura 3D. Aquesta forma final es forma i es manté units a través de la interacció iònica, els ponts disulfur i les forces de van de Waals.

Quatre nivells d’estructura de proteïnes. Imatge de Khanacademy.org.

Mètodes i programes de predicció de l'estructura de proteïnes

Es desenvolupen un gran nombre de programes de predicció d’estructures per a característiques i proteïnes de proteïna dedicades, com predicció de trastorns, predicció de dinàmiques, predicció de conservació d’estructures, etc. Els mètodes inclouen modelatge d’homologia, rosca de proteïnes, mètodes ab initio, predicció d’estructures secundàries i hèlix transmembrana i predicció de pèptids del senyal.

L’elecció del mètode adequat comença sempre utilitzant la seqüència primària de la proteïna desconeguda i cercant homòlegs a la base de dades de proteïnes (figura 2).

Gràfic de presa de decisions sobre el mètode de predicció de l'estructura de proteïnes.

A continuació, es detallen alguns mètodes detallats per predir l'estructura de proteïnes:

  • Eines de predicció d’estructures secundàries

Aquestes eines prediuen estructures secundàries locals basades només en la seqüència d'aminoàcids de la proteïna. Les estructures prediccions es comparen després amb la puntuació DSSP, que es calcula a partir de l'estructura cristal·logràfica de la proteïna (més informació sobre la puntuació DSSP aquí).

Els mètodes de predicció de l'estructura secundària es basen principalment en bases de dades d'estructures de proteïnes conegudes i mètodes moderns d'aprenentatge de màquines com ara xarxes neuronals i màquines vectorials de suport.

A continuació, es mostren algunes excel·lents eines per a la predicció d’estructures secundàries.

  • Estructura terciària

Les eines de predicció de l'estructura terciària (o 3-D) es divideixen en dos mètodes principals: Ab initio i modelat comparatiu de proteïnes.

Els mètodes de predicció de l'estructura de proteïnes Ab initio (o de novo) intenten predir estructures terciàries a partir de seqüències basades en principis generals que regeixen les energies de plegament de proteïnes i / o tendències estadístiques de característiques conformacionals que adquireixen les estructures natives, sense l'ús de plantilles explícites.

Tota la informació sobre l’estructura terciària d’una proteïna està codificada en la seva estructura primària (és a dir, la seva seqüència d’aminoàcids). Tanmateix, es pot preveure un gran nombre d’ells, entre els quals només un té l’energia lliure i l’estabilitat mínimes necessàries per plegar-se correctament. La predicció de l'estructura de proteïnes Ab initio requereix, doncs, una gran quantitat de poder computacional i temps per resoldre la conformació nativa d'una proteïna, i continua sent un dels principals reptes de la ciència moderna.

Els servidors més populars inclouen Robetta (utilitzant el paquet de programari Rosetta), SWISS-MODEL, PEPstr, QUARK. Consulteu una llista exhaustiva aquí.

Si una proteïna d’estructura terciària coneguda comparteix almenys el 30% de la seva seqüència amb un homòleg potencial d’estructura no determinada, es poden utilitzar mètodes comparatius que superposen l’estructura putativa desconeguda amb la coneguda per predir la probable estructura de l’incògnit. El modelatge d’homologia i el filet de proteïnes són dues estratègies principals que utilitzen informació prèvia sobre altres proteïnes similars per proposar una predicció d’una proteïna desconeguda, basada en la seva seqüència.

El programari d’homologia i el model de fil de proteïnes inclouen RaptorX, FoldX, HHpred, I-TASSER i molt més.

Referències

Predicció de nova estructura de proteïnes. Viquipèdia.

Predicció de l'estructura de proteïnes. Viquipèdia