Ànalisi bioinformàtic dels genomes i proteomes de les soques A i B del virus de la grip

Marta Huguet TravéTítol:          Ànalisi bioinformàtic dels genomes i proteomes de les soques A i B del virus de la grip.
Autor/a:     Marta Huguet Travé
Tutor/a:      Ferran Conill
Modalitat:  Ciències i tecnologia: Ciències de la Salut
Àrea:          Biotecnologia
Centre:       Ins Jaume I
Localitat:   Salou

Objectius:
  1. Realitzar un estudi comparatiu del genoma de les diferents soques dels virus de la grip A i B, per identificar i analitzar els canvis i mutacions produïts, tant en gens, així com els canvis que han originat en les corresponents proteïnes, com a conseqüèn

  2. Estudiar com aquests canvis afecten en la patogenicitat del virus i perquè s’han produït.

  3. Anàlisi de les variacions en l’estructura tridimensional de les proteïnes hemaglutinina i neuraminidasa, associades a la diversificació del virus de la grip.

  4. Realitzar arbres filogenètics a partir dels diferents segments del genoma per determinar les relacions evolutives entre les diferents soques del virus de la grip.

El procés:

3.1.ESPÈCIE SELECCIONADA
En el present treball s’ha realitzat una anàlisi comparada del genoma de les diferents soques, actualment seqüenciades, del virus de la grip (família Ortomixoviridae, grup V de la classificació de Baltimore).
3.2.OBTENCIÓ DELS GENOMES
Els genomes de les diferents soques analitzades han estat obtinguts de les següents bases de dades públiques:
• Genoma de la soca A: National Center for Biotechnology Information
• (NCBI) <https://www.ncbi.nlm.nih.gov/genome/10290>
• Genoma de la soca B: Kyoto Encyclopedia of Genes and Genomes (KEGG) <http://www.genome.jp/dbget-bin/www_bget?gn:T40039>
3.3. ANÀLISI DE LES SEQÜÈNCIES GENÒMIQUES
Per realitzar la comparació de les seqüències genòmiques de cadascun dels segments de les diferents soques analitzades, s’ha utilitzat l’anomenat format FASTA, compatible amb les diferents eines informàtiques d’anàlisi.
En el cas de les seqüències de la grip B, com que la base de dades GenomeNet <http://www.genome.jp/dbget-bin/www_bget?gn:T40039>proporciona les seqüències en un format diferent del necessari per a les comparacions, s’ha utilitzat el programa Format Conver <http://www.genome.jp/dbget-bin/www_bget?gn:T40039> de la pàgina HIV per convertir les seqüències a format FASTA.
Per fer els alineaments entre les seqüències de les diferents soques i per veure’n les diferències entre aquestes, s’ha utilitzat el programa Clusta Omega <https://www.ebi.ac.uk/Tools/msa/clustalo/>
Web pertanyent a l’European Bioinformatics Institute (EBI) . Aquest mateix programa també ha estat utilitzat per a generar els corresponents arbres filogenètics moleculars.
Com a soca patró, respecte de la qual poder comparar les altres, s’ha establert la soca (A/Korea/426/1968(H2N2)), ja que és la primera de la qual s’ha obtingut el seu genoma completament seqüenciat.
3.4. ANÀLISI DE LES SEQÜÈNCIES PROTEIQUES
Com que no totes les mutacions genòmiques es tradueixen en variacions aminoacídiques, s’ha realitzat, igualment, una comparació de les seqüències proteiques de les diferents proteïnes codificades pel virus de la grip.
Per fer aquesta anàlisi s’ha utilitzat el mateix programa informàtic – Clusta Omega – que en el cas de les seqüències genòmiques.
3.5. ANÀLISI DE L’ESTRUCTURA TRIDIMENSIONAL DE LES PROTEÏNES
Seguidament, per realitzar una imatge de l’estructura tridimensional de les proteïnes i per observar de quines estructures secundàries estan formades, s’ha utilitzat el programa bioinformàtic -PDBsum-<https://www.ebi.ac.uk/thornton-srv/databases/cgi-bin/pdbsum/GetPage.pl?pdbcode=index.html> també pertanyent a l’EBI. Aquesta anàlisi únicament s’ha realitzat amb dues proteïnes de superfície, l’hemaglutinina i la neuraminidasa, ja que, han estat les que els seus nucleòtids i aminoàcids han tingut uns valors mutacionals més elevats, superant el 50%.

Conclusions:

En una comparativa general de tots els resultats obtinguts anteriorment es mostra com hi ha una certa relació entre els resultats de les diferents parts realitzades. I per tant es pot arribar a unes conclusions en comú.
Primer de tot es pot establir una tendència en la diversificació seguida per la majoria dels gens dels diversos segments, tot i no ser exactament la mateixa en tots.
En aquesta tendència, Nova York seria la soca més semblant a la de Corea i la menys mutada respecte a aquesta. Seguida per la soca de Califòrnia. I per últim, la menys semblant Xangai. Això tenint en compte únicament les soques de la grip A.
Aquesta tendència segueix una relació temporal també. Això és degut que les mutacions s’acumulen d’una generació a una altra, causant un major nombre de mutacions en les soques més modernes, com és el cas de la soca de Xangai.
Per contra, la grip B és la menys semblant a la soca Corea. Aquest resultat és corrent amb el fet que es tracta d’una soca diferent del virus i, per tant, es va separar evolutivament abans.
En alguns segments es pot observar una diferència en el percentatge de nucleòtids i d’aminoàcids substituïts en el mateix segment. Això pot venir causat per la presència de mutacions silencioses i revertides.
Dels diferents segments del genoma del virus, cal destacar-ne dos d’aquests, el quart i el sisè, en què, en general, el percentatge de mutacions ha estat molt major al dels altres segments. Aquest fet ve directament relacionat amb els resultats obtinguts per la comparativa de les proteïnes. L’hemaglutinina i la neuraminidasa, que són les proteïnes codificades, respectivament, per aquests dos segments, també han estat les dues proteïnes amb un nombre més elevat de canvis en totes les soques. Més del 50% dels seus aminoàcids han estat canviats respecte a la soca de referència. Mentre que les altres proteïnes han tingut valors molt més baixos.
Els arbres evolutius mostren que totes les soques siguin de la grip A o B provenen d’un mateix antecessor evolutiu
.A més a més, les soques Xangai i Califòrnia, de la grip A, són similars en característiques i també pròximes evolutivament. El mateix succeeix entre les soques de Corea i Nova York.
Els arbres filogenètics deduïts a partir dels genomes mostren el mateix patró de diversificació que els deduïts a partir de proteïnes.
Les estructures secundàries de l’hemaglutinina i la neuraminidasa també mostren el mateix tipus de relació entre els parells de soques comentats anteriorment. Comparteixen una gran similitud d’estructura. Ambdues proteïnes s’assemblen en totes les soques perquè són globulars i perquè estan formades principalment per fulles β.

Bibliografia:
  • Attwood,T.K i Parry-Smith, D.J,Introducción a la BioinformáticaPrentice Hall
  • Madigan.M, Martinko.J, Bender.K i Buckley.D,Biology of microorganisesGlobal Edition
  • Murray, Rosenthal i PfallerMicrobiología MédicaS.A. ELSEVIER ESPAÑA
  • Shors, ToriEstudio molecular con orientación clínicaEditorial Mèdica Panamèricana
Llocs Web:
Presentació: