12
© Universidad Técnica Particular de Loja 2013 1 Bioinformática - Bioinformatic Alineamiento de secuencias y filogenia Argenis Riofrío 1 , María Cristina Vivianco 2 1 Escuela de Ciencias de la Computación – [email protected] 2 Escuela de Bioquímico y Farmacia – [email protected] ABSTRACT En las últimas décadas se ha incrementado el conocimiento en áreas como la Genética y la Biología Molecular gracias a avances tecnológicos logrados mediante una investigación interdisciplinaria que ha permitido establecer vínculos entre la medicina, la biología, la química y las ingenierías. El uso de la bioinformática es necesa- ria para que el investigador logre transformar datos biológicos en información útil, que permita el desarrollo de nuevas tecnologías, por lo que en este artículo se presenta el proceso para el alinea- miento múltiple de secuencias (AMS) de 52 especies selecciona- das del reino fungi, en su gran mayoría del genero Calvatia, indi- cando el proceso y descripción de la metodología utilizada para lograr el alineamiento de secuencias y finalmente construir la filogenia molecular. Resaltando el software utilizado, estrategias, metodologías y algoritmos. PALABRAS CLAVE Alineamiento Múltiple de Secuencias, ADN, Filogenia Molecular 1 INTRODUCCIÓN Hoy en día es muy común escuchar sobre el tema del proyecto del Genoma Humano dentro del campo científico y esto ha llevado a que existe una gran cantidad de información sobre la composición de los aminoácidos, por lo tanto se debe recurrir al uso de herra- mientas bioinformáticas que permitan procesar rápidamente esta información, constituyéndose de esta manera el centro de esta ciencia. En este contexto, el alineamiento de dos o más secuencias de DNA permite conocer su relación evolutiva, es decir conocer si las dos secuencias o más de DNA tienen un ancestro común, para llegar a ello se presentan una gran variedad de métodos y algoritmos que el paso de los años han sido determines para fortalecer este proyecto del Genoma Humano. * To whom correspondence should be addressed. * To whom correspondence should be addressed. El primer eslabón en este proceso es el alineamiento múltiple de secuencias, que en principio se puede ver muy sencillo, es posible determinar el alineamiento óptimo entre dos secuencias elaborando todos los alineamientos posibles y calculando para cada uno de ellos la suma de las puntuaciones de los residuos alineados. Sin embargo, esto constituye un problema cuando existen “gaps”, en este caso el número de alineamientos posibles entre las dos se- cuencias de DNA es muy grande y el cálculo exhaustivo es muy difícil de alcanzar usando los actuales recursos computacionales [1]. Determinar el grado de semejanza entre dos secuencias de DNA requiere elaborar el alineamiento y contar (directa o indirectamen- te) el número de posiciones equivalentes conservadas. Cuando la relación entre dos secuencias es lejana y exhiben una pobre con- servación global elaborar el alineamiento no es trivial, puesto que es difícil (si no imposible) identificar los aminoácidos equivalentes en las dos secuencias, en particular porque residuos individuales e incluso regiones enteras de la proteína pueden haber desaparecido (o haberse insertado) a lo largo de la evolución en una de las dos secuencias. Entonces, varios algoritmos progresivos son utilizados e implementados en software, los cuales son simples, utilizan pocos recursos computacionales, emplean poco tiempo y los resul- tados presentan un nivel de acierto muy aceptable. Sin embargo, la desventaja es que los resultados generados son de índole heurísti- co, es decir, los resultados son aproximados. Teniendo en consideración lo dicho anteriormente es importa considera que antes de que cualquier secuencia pueda ser utilizada para la reconstrucción filogenética, estas deben ser alineadas, siendo la calidad de este procedimiento un factor que afecta la calidad de la filogenia inferida, que es lo que se pretende logar con al finalizar este artículo, por lo que se ha seleccionado a MAFFT como software para realizar el alineamiento múltiple de secuen- cias, por su rapidez al realizar alineamientos de un gran número de secuencias en tiempos relativamente cortos y por su variedad de estrategias de alineamientos entre ellas las Transformaciones Rá- pidas de Fourier (FFT). En otro aspecto se tiene la filogenia molecular, la cual hace refe- rencia a las relaciones evolutivas entre los organismos (especies, géneros, familias). El estudio de las relaciones entre las especies ha formado implícitamente parte en los estudios de taxonomía clásica desde el siglo XVI [2].

Trabajo Final Bioinformatica 2013

Embed Size (px)

Citation preview

Page 1: Trabajo Final Bioinformatica 2013

© Universidad Técnica Particular de Loja 2013 1

Bioinformática - Bioinformatic

Alineamiento de secuencias y filogenia Argenis Riofrío1, María Cristina Vivianco2 1 Escuela de Ciencias de la Computación – [email protected] 2 Escuela de Bioquímico y Farmacia – [email protected]

ABSTRACT

En las últimas décadas se ha incrementado el conocimiento en áreas como la Genética y la Biología Molecular gracias a avances tecnológicos logrados mediante una investigación interdisciplinaria que ha permitido establecer vínculos entre la medicina, la biología, la química y las ingenierías. El uso de la bioinformática es necesa-ria para que el investigador logre transformar datos biológicos en información útil, que permita el desarrollo de nuevas tecnologías, por lo que en este artículo se presenta el proceso para el alinea-miento múltiple de secuencias (AMS) de 52 especies selecciona-das del reino fungi, en su gran mayoría del genero Calvatia, indi-cando el proceso y descripción de la metodología utilizada para lograr el alineamiento de secuencias y finalmente construir la filogenia molecular. Resaltando el software utilizado, estrategias, metodologías y algoritmos.

PALABRAS CLAVE Alineamiento Múltiple de Secuencias, ADN, Filogenia Molecular

1 INTRODUCCIÓN Hoy en día es muy común escuchar sobre el tema del proyecto del Genoma Humano dentro del campo científico y esto ha llevado a que existe una gran cantidad de información sobre la composición de los aminoácidos, por lo tanto se debe recurrir al uso de herra-mientas bioinformáticas que permitan procesar rápidamente esta información, constituyéndose de esta manera el centro de esta ciencia. En este contexto, el alineamiento de dos o más secuencias de DNA permite conocer su relación evolutiva, es decir conocer si las dos secuencias o más de DNA tienen un ancestro común, para llegar a ello se presentan una gran variedad de métodos y algoritmos que el paso de los años han sido determines para fortalecer este proyecto del Genoma Humano.

*To whom correspondence should be addressed. *To whom correspondence should be addressed.

El primer eslabón en este proceso es el alineamiento múltiple de secuencias, que en principio se puede ver muy sencillo, es posible determinar el alineamiento óptimo entre dos secuencias elaborando todos los alineamientos posibles y calculando para cada uno de ellos la suma de las puntuaciones de los residuos alineados. Sin embargo, esto constituye un problema cuando existen “gaps”, en este caso el número de alineamientos posibles entre las dos se-cuencias de DNA es muy grande y el cálculo exhaustivo es muy difícil de alcanzar usando los actuales recursos computacionales [1]. Determinar el grado de semejanza entre dos secuencias de DNA requiere elaborar el alineamiento y contar (directa o indirectamen-te) el número de posiciones equivalentes conservadas. Cuando la relación entre dos secuencias es lejana y exhiben una pobre con-servación global elaborar el alineamiento no es trivial, puesto que es difícil (si no imposible) identificar los aminoácidos equivalentes en las dos secuencias, en particular porque residuos individuales e incluso regiones enteras de la proteína pueden haber desaparecido (o haberse insertado) a lo largo de la evolución en una de las dos secuencias. Entonces, varios algoritmos progresivos son utilizados e implementados en software, los cuales son simples, utilizan pocos recursos computacionales, emplean poco tiempo y los resul-tados presentan un nivel de acierto muy aceptable. Sin embargo, la desventaja es que los resultados generados son de índole heurísti-co, es decir, los resultados son aproximados. Teniendo en consideración lo dicho anteriormente es importa considera que antes de que cualquier secuencia pueda ser utilizada para la reconstrucción filogenética, estas deben ser alineadas, siendo la calidad de este procedimiento un factor que afecta la calidad de la filogenia inferida, que es lo que se pretende logar con al finalizar este artículo, por lo que se ha seleccionado a MAFFT como software para realizar el alineamiento múltiple de secuen-cias, por su rapidez al realizar alineamientos de un gran número de secuencias en tiempos relativamente cortos y por su variedad de estrategias de alineamientos entre ellas las Transformaciones Rá-pidas de Fourier (FFT). En otro aspecto se tiene la filogenia molecular, la cual hace refe-rencia a las relaciones evolutivas entre los organismos (especies, géneros, familias). El estudio de las relaciones entre las especies ha formado implícitamente parte en los estudios de taxonomía clásica desde el siglo XVI [2].

Page 2: Trabajo Final Bioinformatica 2013

Bioinformatic

2

La obtención de filogenias moleculares se basa en la selección, amplificación y secuenciación de regiones de ADN nuclear, plasti-dial (en plantas) y mitocondrial (de uso frecuente en animales y esporádico en algunas familias de plantas). Dichas secuencias son revisadas, alineadas en función de sus homologías y posterior-mente analizadas bajo las asunciones de los distintos métodos de reconstrucción filogenética, de dichas secuencias bajo los distintos métodos de inferencia, que resumen se creará uno o más árboles de genes que representan las relaciones evolutivas de las muestras analizadas, y que a partir de estos árboles, si el muestreo taxonó-mico y de regiones ha sido adecuado, se pueden realizar inferen-cias sobre las relaciones evolutivas de las especies. Es importante considera que para la elaboración de este artículo se seleccionó 52 secuencias de especies del género de Calvatia perte-necientes al reino Fungi,

2 CALVATIA, BARCHERIA Y LEUCOAGARICU Antes de proceder al explicar la metodología utilizada para realizar el alineamiento de secuencias es conveniente detenernos a indicar cuales son las especies seleccionadas para cada secuencia, ya que se consideró 3 géneros, los cuales son la Calvatia, Bacheria y Leucoagicu, las cuales tiene el siguiente orden.

• Reino: Fungi • Subreino: Dikarya • División: Basidiomycota • Subdivisión: Agaricomycotia • Clase: Agaricomycetes • Orden: Agaricales • Family: Agaricaceae

El primero de estos géneros es la Calvatia.

Figura 1. Calvatia cyathiformis,(Bosc) Morgan o Lycoperdon cyathiforme, Bosc. pintado por Charles H. Peck's en 1895.

Fuente: http://www.amanitacesarea.com/calvatia.html

La Calvatia es un género perteneciente a la familia Agaricaceae donde las esporas se expulsan por un agujero o por la ruptura del exoperidio en forma irregular, no estrellada. Tienen forma más o menos globosa, con un recubrimiento general exoperidio (capa más externa del peridio1) que contiene la gleba, donde maduran las esporas hasta ser expulsadas [4]. Otro género a considerar es la Barcheria la cual son hongos perte-neciente a la familia Agaricaceae. El género es monotípico y con-siste en una única especie Barcheria willisiana,a cual también es considerada en este proceso. En la siguiente Tabla 1., se listan todas las secuencias utilizadas para cada especie y género.

Tabla1. Géneros y especies utilizadas en este artículo.

3 METODOLOGÍA

3.1 Alineamiento de Secuencias

3.1.1. Selección de secuencias

El primer paso para realizar un alineamiento múltiple es contar con las secuencias necesarias para llevar a cabo el análisis. En este caso se utilizó 52 secuencias del reino fungí de la familia Agaricaceae, de las cuales 50 secuencias son pertenecientes al Genero Calvatia y 1 al Genero Barcheria y otra al Genero Leucoagaricus, distribuidos de la siguiente manera, como se puede ver en las Tablas 2 a la 7.

1 Peridio: Capa externa en algunas fructificaciones, como algunos esporan-gios, esporóforos, ascocarpos y algunos basidiocarpos

Page 3: Trabajo Final Bioinformatica 2013

Alineamiento de secuencias y filogenia

3

Tabla 2. Distribución de las 12 secuencias de la Calvatia Gigantea

Tabla 3. Distribución de las 12 secuencias de la Calvatia Fragilis

Tabla 4. Distribución de las 7 secuencias de la Calvatia Cyathifor-

mis var. Cyathiformis

Tabla 5: Distribución de las 2 secuencias de la Calvatia Chilensis

Tabla 6: Distribución de las otras 10 secuencias

Tabla 7: Distribución del resto de secuencias de los géneros Bar-cheria y Leucoagaricus

3.1.1. Búsqueda y descarga de secuencias.

Para realizar la búsqueda de secuencias se la realizo direc-tamente sobre el GenBank2, el cual es parte de International Nucleotide Sequence Database Collaboration, que está inte-grada por la base de datos de ADN de Japón (DNA Data-Bank of Japan (DDBJ)), El Laboratorio Europeo de Biolo-gía Molecular (European Molecular Biology Laboratory (EMBL)), y el GenBank en el National Center for Biotech-nology Information (NCBI3). Una vez que estamos en la página del GenBank como se muestra en la Figura 2. Se procede a buscar los nucleótidos que se relaciones con la Calvatia que es genero de hongos con el cual se va a trabajar, asi mismo hacemos con los otros dos géneros como Barcheria y Leuciagaricus.

2 GenBank: http://www.ncbi.nlm.nih.gov/genbank/ 3 NCBI: http://www.ncbi.nlm.nih.gov/

Page 4: Trabajo Final Bioinformatica 2013

Bioinformatic

4

Figura 2: Página principal de GenBank

Luego de realizar la búsqueda obtenemos todas las coinci-dencias de las secuencias de nucleótidos relacionadas con la Calvatia, para lo cual se puede seleccionar todas o las se-cuencias que deseemos. A demás en la parte izquierda de los resultados de búsquedas aparece una árbol que indica el top del organismo relacionado con la búsqueda desde la cual se puede ver los diferentes tipos de especies del Género Calva-tia tal como se muestra en la Figura 3.

Figura 3: Top Organisms en los resultados de búsqueda Lo mismo se realizara para los otros dos géneros considera-dos en este trabajo. Luego que tenemos la búsqueda realizada y se ha seleccio-nado todas las secuencias se procedemos a realizar la des-carga de la siguiente manera.

- Añadimos al clipboard, todas las secuencias selec-cionadas (Figura 4).

- Seguido de ello elegimos el formato de descarga para nuestro caso FASTA y procedemos a dar click en Create File y guardamos (Figura 5).

Figura 4: Añadir las secuencias seleccionadas al Clipboard

Figura 5: Descarga de Secuencias.

Existe otra forma de poder realizarlo y conociendo las el identificador de cada secuencia, y el procedimiento sería el mismo, solo que tendríamos que copiar todo lo que se en-cuentra en la Figura 6 en el campo de búsqueda remplazan-do el nombre del género Calvatia como se lo busco en un principio, luego el procedimiento sería el mismo.

3.1.2. Selección de software para alineamiento de secuencias.

Figura 6: Identificadores de secuencias

Luego de descargar el archivo con todas las secuencias procedemos a editarlo para recortar los nombres y quedar-nos únicamente con la información que necesitamos, incluso se en nuestro caso se tuvo que eliminar algunas secuencias debido a que no eran acordes con el resto de secuencias ya que existían exceso de gaps que dificultaban su interpreta-ción .

EF190318,EF190317,EF190316,EF190315,EF190314,EF190313,AF518603,HM237179,AJ617492,AJ237864,AF026665,AJ486871,AJ486870,AJ486964,AJ486963,AJ486962,AJ486961,AJ486960,AJ486959,AJ486958,AJ486957,AJ617493,AJ237865,AJ486868,AJ486867,AJ486866,AJ486864,AJ486873,AJ486872,AJ486865,AJ486966,AJ486965,AB509867,GU939632,AJ486869,EU833652,FJ772413,AJ237863,AF485064,EU833651,EU833653,JQ734547,AY372216,AY372212,JF495038,JF495037,JF495036,JF495035,JF495021,JF495020,JF495019,AY372214

Page 5: Trabajo Final Bioinformatica 2013

Alineamiento de secuencias y filogenia

5

Es importante resaltar que se trabajará sobre las secciones ITS1, 5.8S y 18S casi en todas las secuencias seleccionadas

3.1.1. Selección del software de alineamiento múltiple

Es muy importar resaltar que el alineamiento de secuencias se hizo sobre ácidos nucleótidos y para seleccionar las he-rramientas se ha considerado varios parámetros tales como los algoritmos que implementan y sus características computacionales como:

• Precisión Biológica • Tiempo de ejecución • Uso de memoria

Entre los programas que tiene una buena precisión bilógica están

- MAFFT4 - Muscle - Probcon - T-Coffee

Existen otros que se características por su capacidad de rapidez al momento se realizar el alineamiento entre estos se destacan.

- MAFFT - Muscle

Y los que tiene un bajo consumo se memoria en el procesa-

miento esta: - ClustalW

En base a esto criterios se selecciona a MAFFT, porque es que tiene buena precisión biológica y es considerablemente rápido en ejecutar estas tareas, al igual a su funcionamiento ya que inicialmente realiza un alineamiento por métodos progresivos y luego es refinado por métodos iterativos. Para los métodos de alineamiento progresivo es utilizada una aproximación de las transformadas de Fourier (FT). MAFTT es uno de los métodos más rápidos entre las herra-mientas de alineamiento múltiple actualmente disponibles y ha sido utilizado en varios proyectos tales como Pfam (base de datos de familia de proteínas), Astral (Compendio de bases de datos y herramientas para el análisis de estructuras proteicas) y Merops (Base de datos de peptidasas) [6]. La versión 5 de MAFFT generó una mayor exactitud que otros métodos de amplio uso, incluyendo la versión 2 de Tcoffe y Clustal W en un test de prueba consistente en más de 50 secuencias.

4 MAFFT: http://mafft.cbrc.jp/alignment/software/

3.1.2. Alineamiento de secuencias utilizando MAFFT

Luego que tenemos el archivo con todas las secuencias de cada especie seleccionada, lo vamos a copiar en la carpeta que contiene el programa MAFFT, la cual se la copio en el disco C5, C:\mafft-win como se muestra en la Figura 7, nuestro archivo se llama Secuences02.fasta.

Figura 7: Copia del archivo de las secuencias en la carpeta

mafft-win Seguido de ellos procedemos a ejecutar el archivo mafft.bat y seguimos las instrucciones como se va pidiendo, esto se muestra en la Figura 8.

- Fijamos el archivo de entrada - Fijamos el archivo de salida - Fijamos el formato de salida. En nuestro caso se-

leccionares la opción 2. - Se nos pide seleccionar la estrategia. Para este caso

utilizaremos FFT (Transformaciones Rápidas de Fourier) - FFT-NS-2, Opción 3

- Aceptamos y comienza el proceso de alineamiento

Figura 8. Ejecución del MAFFT para el alinea-

miento de secuencias 5 MAFFT en este artículo está siendo usado sobre el sistema operativo Windows 7.

Page 6: Trabajo Final Bioinformatica 2013

Bioinformatic

6

Finalmente se obtiene el resultado archivo con las secuen-cias alineadas.

3.1.3. Visualización del alineamiento

Para la visualización y edición del archivo con contiene nuestro alineamiento se lo puede hacer desde varios pro-gramas como PhyDe Figura 9.

Figura 9: Visualización del alineamiento de secuencias con PhyDe

Aunque también existen otros programas que nos permiten visualizar el alineamiento como MEGA 5, y también poder tener algunas opciones para poder realizar el análisis del mismo.

Figura 9: Visualización del alineamiento de secuencias con

Mega 5

Figura 10: Visualización con JalView

3.1.4. Análisis de alineamiento

Generalmente los programas de visualización y edición nos permitirán realizar el análisis de estas secuencias alineadas ya que una vez obtenidas las secuencias, es necesario agru-parlas para construir la matriz de datos. Para ello se colocan las secuencias superpuestas, de tal manera que cada fila corresponde a una muestra y cada columna a un carácter. Este es el proceso que se denomina alineamiento, y busca enfrentar aquellas partes de las secuencias que son homólo-gas6, para así poder identificar mutaciones, inserciones, deleciones, inversiones, etc. producidas entre las muestras estudiadas.

Figura 11: Búsqueda de Homología en el alineamiento Por ejemplo en la Figura 11, podemos ver que de las 9 se-cuencias de Calvatia Gigantea, la secuencia 7 ha sufrido una deleción desde la posición 420 a la 425 en relación a sus semejantes. Pero la correcta elaboración del alineamiento constituye un paso fundamental para la obtención de una buena filogenia, dado que la topología de los árboles filogenéticos que se obtengan al final del proceso está totalmente condicionada por las asunciones de homología reflejadas en la matriz de identidad, esta se la puede ver en el Anexo 1. En este análisis también hemos creído considerar la relación de las posiciones bien conservadas y variantes de las se-cuencias de lo cual se tiene que:

- 351 posiciones bien conservadas de 1213 - 721 posiciones variables de 1213 - 157 posiciones tiene un solo nucleótido en esa ali-

neamiento

También podemos observar en el anexo 2 la composición de cada especie respecto a los nucleótidos, de manera general 6 Homólogas: Que son idénticas o con el menor número de cambios posible

Page 7: Trabajo Final Bioinformatica 2013

Alineamiento de secuencias y filogenia

7

se puede observar que todas las especies tiene una composi-ción.

T(U

)

Cito

cina

Ade

noci

na

Gua

nina

29,8% 21,2% 24,4% 24,6%

Tabla 2: Resumen de la composición de nucleótidos expre-

sado en porcentaje

3.2 Filogenia Molecular

El primer paso para realizar la filogenia es iniciar con una muestreo de campo, tras el que se desarrolla el trabajo de laboratorio que consiste en extracción de ADN, amplifica-ción de regiones de ADN y por último secuenciación de los productos. Sin embargo, otros muchos trabajos de filogenia molecular pueden iniciarse a partir de secuencias de ADN que han obtenido otros autores, el cual es nuestro caso ya que las extraimos directamente desde el GenBank [8]. En cualquiera de los dos casos, el planteamiento inicial debe partir del establecimiento de la hipótesis de trabajo que estará sustentada sobre una pregunta biológica a la que queramos dar respuesta, para este artículo queremos conocer de qué manera se relacionan evolutivamente estas las espe-cies consideradas dentro del reino de los Hongos, especial-mente con el género de la Calvatia, Barcharia y Leucoagari-cus. Seguido de ello debemos seleccionar un método para la reconstrucción filogenética pese a que existen muchos métodos y se los puede agrupar de la siguiente manera, según el procedimiento seguido:

(1) MÉTODOS “PURAMENTE ALGORÍTMICOS” a. [UPGMA, Neibourgh-Joining (NJ)]

(2) MÉTODOS DE BÚSQUEDAS DE ÁRBOLES

BASADOS EN CRITERIOS DE OPTIMIZACIÓN

a. Máxima Parsimonia (MP) b. Máxima Verosimilitud (ML; Maximum

Likelihood), c. Inferencia Bayesiana (BI; Bayesian Infe-

rence), d. Mínima Evolución (ME), e. Mínimos Cuadrados (MC).

Los primeros incluyen en el proceso de obtención del árbol el criterio de selección y no hacen búsquedas de árboles, por lo que no realizan de manera explícita una optimización de una función de selección con base en el criterio establecido. Los segundos realizan búsquedas de árboles sobre los que se optimiza una función según el criterio bajo el que son eva-luados –mínimo número de cambios evolutivos en MP, máxima verosimilitud7 en ML, máxima probabilidad a pos-teriori en BI, mínima suma de longitudes de rama (calcula-das como ordinary least square) en ME, o mejor ajuste entre los pares de distancias estimados y las distancias calculadas a partir del árbol, MC. Siguiendo estos criterios hemos seleccionado el Método de Máxima Verosimilitud (Maximum Likelihood), ejecutado desde un programa informático MEGA 5. Pero es importante conocer que se realiza con este método. El método de ML intenta estimar la cantidad de cambio real de acuerdo con un modelo establecido. Este método evalúa la hipótesis (el árbol) mediante una función (verosimilitud) que maximiza la probabilidad de obtener los datos –matriz de secuencias de ADN– dado el árbol y el modelo evoluti-vo8. De esta forma, conforme al criterio de ML el mejor árbol de cuatro secuencias conectadas dos a dos es aquel que pre-sen|ta el mayor valor de verosimilitud, independientemente del número de transformaciones de estados de carácter que necesite[8].

Figura 12: Software Mega 59 utilizado para realizar la re-construcción filogenética

7 La verosimilitud es la credibilidad o congruencia de un elemento determi-nado 8 Los modelos evolutivos en filogenias moleculares describen el modo y la probabilidad de que una secuencia de nucleótidos cambie a otra secuencia de nucleótidos homóloga a lo largo del tiempo. Es decir, estos modelos describen para cada uno de los sitios de la matriz la probabilidad de que se produzca el cambio de un nucleótido a otro a lo largo de las ramas de un árbol filogenético dado. 9 Mega 5: http://www.megasoftware.net/

Page 8: Trabajo Final Bioinformatica 2013

Bioinformatic

8

Como se explicó anteriormente el software utilizado para la reconstrucción filogenética es MEGA 5, la cual es una he-rramienta integrada para llevar a cabo la alineación de se-cuencias, inferir árboles filogenéticos, bases de datos basa-das en la minería web, las tasas de estimación de la evolu-ción molecular, inferir secuencias ancestrales, y las pruebas de hipótesis evolutivas. MEGA es utilizado por los biólogos en un gran número de laboratorios para la reconstrucción de la historia evolutiva de las especies y deducir la magnitud y la naturaleza de las fuerzas selectivas que dan forma a la evolución de genes y especies [9].

3.2.1. Procedimiento

En esta sección se describirá el procedimiento que se siguió para realizar la reconstrucción filogenética, con nuestras secuencias de ADN que se la alineo previamente en la sec-ción anterior. Lo primero que tenemos que hacer es abrir el archivo donde se tiene todas las secuencias alineadas (Alineamiento.fasta), desde el programa MEGA (File � Open A File/Session) Seguido de ellos nos hará una pregunta en la que nos dice que si queremos Analizar o Alinear el archivo, en nuestro caso el archivo ya está alineado por lo que colocamos Ana-lizar (Analyze). La siguiente pregunta es con que datos de entradas estamos trabajando, en este artículo estamos trabajando con nucleo-tidos. Luego de realizar este procedimiento el archivo está dispo-nible para poder utilizar MEGA sin ningún otro inconve-niente como se puede ver en la Figura 9. El siguiente paso es ubicarse en la barra de herramientas ir hasta el botón Phylogeny y seleccionados

Figura 13: Selección del Método de Reconstrucción Filoge-

netica en Mega.

Como se puede ver en la Figura 13. Se está seleccionado el método de Test Maximum Likelihood Tree, que es que nos reconstruirá la filogenia. El siguiente paso será configurar las preferencias de análisis de este método, como se muestra en la Figura 14.

Figura 14: Preferencias de análisis para el Método Maxi-

mum Likelihood

Hay que tener en cuenta que la sección donde dice Phylo-geny Test, por defecto viene None, por lo que hay que cam-biar a Método BootStrap y luego seleccionar el número de replicaciones que se va a realizar, para este caso se seleccio-nó 1000 replicaciones. Como modelo de sustitución de nucleótidos se ha seleccio-nado el Tamura-Nei model. Finalmente se obtiene el árbol Filogenético como se ve en el Anexo 3, y en el Anexo cuadro se indica el árbol filogeneti-co con el Bootstrap10. Finalmente en el árbol filogenético que se muestra en el Anexo 3, nos representa la línea de descendencia evolutiva de las diferencies especies, organismos o de los genes de un ancestro común. Esto apoya la teoría de la evolución pro-puesta por Charles Darwin.

10 El árbol filogenético del anexo 4 fue creado con las mismas preferencias del análisis del primer árbol solo que el número de replicaciones cambio por motivos de consumo computacional a 20 replicaciones, el cual fue elaborado para motivos explicativos

Page 9: Trabajo Final Bioinformatica 2013

Alineamiento de secuencias y filogenia

9

Durante la evolución los linajes a menudo sufren divisiones, los linajes que funcionan separados son cada vez diferentes a medida que se alejan de su ancestro. En este árbol podemos diferenciar tres grupos (tres nodos) estos pertenecen al mismo clado, cada grupo comparte una similitud genética más evidente, pero no se los considera de diferente especie sino que cada grupo representa caracterís-ticas distintas, puede ser en los pares de bases, en los nu-cleótidos. Los números que podemos encontrar en cada clado (conjun-to de especies emparentadas con un antepasado común, que forman una única "rama") representan la diferencia con los demás clados, en este árbol filogenético podemos observar 26 clados. Por ejemplo tenemos en la parte superior que un clado se está diferenciando en un 92% de los demás y tiene más similitud entre su grupo y los que tienen un valor de 50 no se los considera. Los dominios de proteínas se agrupan en familias basadas en similitudes de secuencia (> 30% de identidad de residuo), la estructura o la función. También tenemos dos grupos externos que son la Calvatia gigantea y la Calvatia gigantea isolate.

REFERENCIAS

[1] Lozano, M. A., & MEDINA, J. V. (2006). Diseño de un procesador para el aliea-

miento global de secuencias de DNA. In Iberchip Workshop, Costa Rica(pp. 1-5).

[2] Valcárcel, V. Manual para análisis filogenéticos molecular. Disponible on-line:

http://ocw.uam.es/cursos/valcarcelfilogenia/1_W_Text_1.pdf.

[3] Red Europea de Biología Molecular (Embnet), Introducción a la Bioinformática

Disponible on-line:

http://bioinf.ibun.unal.edu.co/documentos/multAlignmentCBIB.pdf

[4] Guía micótica. Ficha de Especies Disponible on-line:

http://www.amanitacesarea.com/calvatia.html

[5] Poot, C. Alineamiento multiple de secuencias – UNAM

[6] REACTIVOS. Alineamientos de secuencias de aminoácidos. Disponible on-line:

http://www.reactivos.com/images/Capitulo_3_Alineamiento_Secuencias_Amino_cido

s_GQAC.pdf

[7] Draper, I. Manual para análisis filogenéticos moleculares. Disponible on-line:

http://ocw.uam.es/cursos/valcarcelfilogenia/1_W_Text_3.2.pdf

[8] Aguado, M. Manual para análisis filofenéticos moleculares. Disponible on-lne:

http://ocw.uam.es/cursos/valcarcelfilogenia/1_W_Text_3.pdf

[9] MEGA. Software para análisis filogenético. Disponible on – line:

http://www.megasoftware.net/

Page 10: Trabajo Final Bioinformatica 2013

© Universidad Técnica Particular de Loja 2013 10

gi|

12

27

19

22

8|

gb

|E

F1

90

31

8.1

|

gi|

12

27

19

22

7|

gb

|E

F1

90

31

7.1

|

gi|

12

27

19

22

6|

gb

|E

F1

90

31

6.1

|

gi|

12

27

19

22

4|

gb

|E

F1

90

31

4.1

|

gi|

12

27

19

22

3|

gb

|E

F1

90

31

3.1

|

gi|

48

59

66

58

|e

mb

|A

J61

74

92

.1|

gi|

29

90

33

68

1|

gb

|HM

23

71

79

.1|

gi|

22

53

82

60

3|

gb

|F

J77

24

13

.1|

gi|

21

22

76

60

1|

gb

|E

U8

33

65

3.1

|

gi|

21

22

76

59

9|

gb

|E

U8

33

65

1.1

|

gi|

30

52

49

74

|e

mb

|A

J48

68

71

.1|

gi|

30

52

46

95

|e

mb

|A

J48

69

60

.1|

gi|

30

52

46

94

|e

mb

|A

J48

69

59

.1|

gi|

30

52

46

93

|e

mb

|A

J48

69

58

.1|

gi|

30

52

46

92

|e

mb

|A

J48

69

57

.1|

gi|

30

52

49

73

|e

mb

|A

J48

68

70

.1|

gi|

48

59

66

59

|e

mb

|A

J61

74

93

.1|

gi|

30

52

49

71

|e

mb

|A

J48

68

68

.1|

gi|

30

52

49

70

|e

mb

|A

J48

68

67

.1|

gi|

30

52

49

69

|e

mb

|A

J48

68

66

.1|

gi|

30

52

49

67

|e

mb

|A

J48

68

64

.1|

gi|

30

52

49

76

|e

mb

|A

J48

68

73

.1|

gi|

30

52

49

75

|e

mb

|A

J48

68

72

.1|

gi|

30

52

49

68

|e

mb

|A

J48

68

65

.1|

gi|

30

52

49

72

|e

mb

|A

J48

68

69

.1|

gi|

30

52

46

99

|e

mb

|A

J48

69

64

.1|

gi|

30

52

46

98

|e

mb

|A

J48

69

63

.1|

gi|

30

52

46

97

|e

mb

|A

J48

69

62

.1|

gi|

30

52

46

96

|e

mb

|A

J48

69

61

.1|

gi|

21

22

76

60

0|

gb

|E

U8

33

65

2.1

|

gi|

30

52

47

01

|e

mb

|A

J48

69

66

.1|

gi|

30

52

47

00

|e

mb

|A

J48

69

65

.1|

gi|

12

27

19

22

5|

gb

|E

F1

90

31

5.1

|

gi|

19

56

91

30

|g

b|A

F48

50

64

.1|

gi|122719228|gb|EF190318.1| 100.00 99.68 99.37 99.84 99.67 99.26 96.28 96.58 96.42 95.98 93.22 93.07 93.37 93.07 93.22 92.76 92.96 92.92 92.92 92.92 92.77 92.77 92.77 92.77 92.77 91.68 92.59 92.44 92.59 94.00 94.61 94.61 95.15 93.18

gi|122719227|gb|EF190317.1| 99.68 100.00 99.37 99.53 99.51 99.37 95.73 96.05 96.05 95.57 94.03 94.03 94.19 94.03 94.03 93.55 93.48 93.56 93.56 93.56 93.40 93.40 93.40 93.40 93.40 92.42 93.05 92.89 93.05 94.27 94.85 94.85 94.82 93.14

gi|122719226|gb|EF190316.1| 99.37 99.37 100.00 99.21 99.01 99.69 95.75 96.07 96.38 95.91 94.03 93.87 93.87 93.71 94.03 93.55 93.51 93.56 93.56 93.56 93.40 93.40 93.40 93.40 93.40 92.74 93.05 92.89 93.05 94.61 94.85 94.85 94.82 93.49

gi|122719224|gb|EF190314.1| 99.84 99.53 99.21 100.00 99.84 99.53 95.92 96.23 96.23 95.75 93.73 93.73 93.89 93.73 93.73 93.25 93.52 93.58 93.58 93.58 93.42 93.42 93.42 93.42 93.42 92.44 93.08 92.91 93.08 94.30 94.86 94.86 94.99 93.19

gi|122719223|gb|EF190313.1| 99.67 99.51 99.01 99.84 100.00 99.35 95.58 95.91 95.90 95.41 93.56 93.40 93.73 93.40 93.56 93.07 93.08 93.25 93.25 93.25 93.08 93.08 93.08 93.08 93.08 91.91 92.56 92.40 92.56 93.89 94.56 94.56 94.74 92.73

gi|48596658|emb|AJ617492.1| 99.26 99.37 99.69 99.53 99.35 100.00 95.38 95.52 95.74 95.33 92.51 92.20 92.35 92.05 92.51 92.05 92.11 91.91 91.91 91.91 91.76 91.76 91.76 91.76 91.76 91.13 91.58 91.42 91.58 93.23 93.58 93.58 95.15 93.90

gi|299033681|gb|HM237179.1| 96.28 95.73 95.75 95.92 95.58 95.38 100.00 99.48 95.24 95.13 92.34 92.19 92.50 92.19 92.34 92.19 91.81 92.35 92.35 92.35 92.20 92.20 92.20 92.20 92.20 91.12 92.02 91.87 92.02 93.81 93.26 93.26 93.38 93.14

gi|225382603|gb|FJ772413.1| 96.58 96.05 96.07 96.23 95.91 95.52 99.48 100.00 95.51 95.13 92.34 92.19 92.50 92.19 92.34 92.19 91.55 92.35 92.35 92.35 92.20 92.20 92.20 92.20 92.20 91.12 92.02 91.87 92.02 93.81 93.57 93.57 93.38 93.14

gi|212276601|gb|EU833653.1| 96.42 96.05 96.38 96.23 95.90 95.74 95.24 95.51 100.00 94.82 91.87 91.56 91.72 91.41 91.87 91.41 91.55 91.58 91.58 91.58 91.42 91.42 91.42 91.42 91.42 90.49 91.24 90.94 91.09 92.80 92.94 92.94 93.05 92.99

gi|212276599|gb|EU833651.1| 95.98 95.57 95.91 95.75 95.41 95.33 95.13 95.13 94.82 100.00 90.80 90.49 90.64 90.34 90.80 90.49 91.01 90.66 90.66 90.66 90.81 90.81 90.81 90.81 90.51 90.49 90.78 90.63 90.78 92.22 92.33 92.33 92.89 92.54

gi|30524974|emb|AJ486871.1| 93.22 94.03 94.03 93.73 93.56 92.51 92.34 92.34 91.87 90.80 100.00 99.08 99.24 99.08 99.54 99.54 97.71 98.32 98.32 98.32 98.17 98.17 98.17 98.17 98.17 95.41 96.02 95.87 95.87 95.41 94.33 94.33 93.15 94.09

gi|30524695|emb|AJ486960.1| 93.07 94.03 93.87 93.73 93.40 92.20 92.19 92.19 91.56 90.49 99.08 100.00 99.69 99.69 99.08 98.78 97.25 97.86 97.86 97.86 97.71 97.71 97.71 97.71 97.71 95.41 95.87 95.56 95.71 94.95 94.18 94.18 93.15 93.77

gi|30524694|emb|AJ486959.1| 93.37 94.19 93.87 93.89 93.73 92.35 92.50 92.50 91.72 90.64 99.24 99.69 100.00 99.69 99.24 98.93 97.55 98.17 98.17 98.17 98.01 98.01 98.01 98.01 98.01 95.26 96.02 95.71 95.87 95.10 94.49 94.49 93.31 93.93

gi|30524693|emb|AJ486958.1| 93.07 94.03 93.71 93.73 93.40 92.05 92.19 92.19 91.41 90.34 99.08 99.69 99.69 100.00 98.93 98.78 97.25 97.86 97.86 97.86 97.71 97.71 97.71 97.71 97.71 95.26 95.87 95.87 95.71 94.79 94.18 94.18 93.15 93.61

gi|30524692|emb|AJ486957.1| 93.22 94.03 94.03 93.73 93.56 92.51 92.34 92.34 91.87 90.80 99.54 99.08 99.24 98.93 100.00 99.39 97.55 98.17 98.17 98.17 98.01 98.01 98.01 98.01 98.01 95.26 95.87 95.56 95.71 95.56 94.49 94.49 93.15 94.25

gi|30524973|emb|AJ486870.1| 92.76 93.55 93.55 93.25 93.07 92.05 92.19 92.19 91.41 90.49 99.54 98.78 98.93 98.78 99.39 100.00 97.25 97.86 97.86 97.86 97.71 97.71 97.71 97.71 97.71 94.95 95.56 95.41 95.41 94.95 93.87 93.87 92.66 93.61

gi|48596659|emb|AJ617493.1| 92.96 93.48 93.51 93.52 93.08 92.11 91.81 91.55 91.55 91.01 97.71 97.25 97.55 97.25 97.55 97.25 100.00 99.08 99.08 99.08 99.54 99.54 99.54 99.54 98.63 94.80 95.71 95.41 95.56 94.68 93.72 93.72 93.16 94.04

gi|30524971|emb|AJ486868.1| 92.92 93.56 93.56 93.58 93.25 91.91 92.35 92.35 91.58 90.66 98.32 97.86 98.17 97.86 98.17 97.86 99.08 100.00 100.00 100.00 99.54 99.54 99.54 99.54 99.54 95.11 96.32 96.02 96.17 95.10 94.33 94.33 93.32 93.45

gi|30524970|emb|AJ486867.1| 92.92 93.56 93.56 93.58 93.25 91.91 92.35 92.35 91.58 90.66 98.32 97.86 98.17 97.86 98.17 97.86 99.08 100.00 100.00 100.00 99.54 99.54 99.54 99.54 99.54 95.11 96.32 96.02 96.17 95.10 94.33 94.33 93.32 93.45

gi|30524969|emb|AJ486866.1| 92.92 93.56 93.56 93.58 93.25 91.91 92.35 92.35 91.58 90.66 98.32 97.86 98.17 97.86 98.17 97.86 99.08 100.00 100.00 100.00 99.54 99.54 99.54 99.54 99.54 95.11 96.32 96.02 96.17 95.10 94.33 94.33 93.32 93.45

gi|30524967|emb|AJ486864.1| 92.77 93.40 93.40 93.42 93.08 91.76 92.20 92.20 91.42 90.81 98.17 97.71 98.01 97.71 98.01 97.71 99.54 99.54 99.54 99.54 100.00 100.00 100.00 100.00 99.08 95.26 96.17 95.87 96.02 94.95 94.18 94.18 93.16 93.61

gi|30524976|emb|AJ486873.1| 92.77 93.40 93.40 93.42 93.08 91.76 92.20 92.20 91.42 90.81 98.17 97.71 98.01 97.71 98.01 97.71 99.54 99.54 99.54 99.54 100.00 100.00 100.00 100.00 99.08 95.26 96.17 95.87 96.02 94.95 94.18 94.18 93.16 93.61

gi|30524975|emb|AJ486872.1| 92.77 93.40 93.40 93.42 93.08 91.76 92.20 92.20 91.42 90.81 98.17 97.71 98.01 97.71 98.01 97.71 99.54 99.54 99.54 99.54 100.00 100.00 100.00 100.00 99.08 95.26 96.17 95.87 96.02 94.95 94.18 94.18 93.16 93.61

gi|30524968|emb|AJ486865.1| 92.77 93.40 93.40 93.42 93.08 91.76 92.20 92.20 91.42 90.81 98.17 97.71 98.01 97.71 98.01 97.71 99.54 99.54 99.54 99.54 100.00 100.00 100.00 100.00 99.08 95.26 96.17 95.87 96.02 94.95 94.18 94.18 93.16 93.61

gi|30524972|emb|AJ486869.1| 92.77 93.40 93.40 93.42 93.08 91.76 92.20 92.20 91.42 90.51 98.17 97.71 98.01 97.71 98.01 97.71 98.63 99.54 99.54 99.54 99.08 99.08 99.08 99.08 100.00 94.95 96.02 95.72 95.87 95.25 94.49 94.49 93.16 93.29

gi|30524699|emb|AJ486964.1| 91.68 92.42 92.74 92.44 91.91 91.13 91.12 91.12 90.49 90.49 95.41 95.41 95.26 95.26 95.26 94.95 94.80 95.11 95.11 95.11 95.26 95.26 95.26 95.26 94.95 100.00 96.17 96.02 96.17 94.18 92.96 92.96 92.33 93.13

gi|30524698|emb|AJ486963.1| 92.59 93.05 93.05 93.08 92.56 91.58 92.02 92.02 91.24 90.78 96.02 95.87 96.02 95.87 95.87 95.56 95.71 96.32 96.32 96.32 96.17 96.17 96.17 96.17 96.02 96.17 100.00 99.39 99.54 95.09 94.48 94.48 93.14 93.12

gi|30524697|emb|AJ486962.1| 92.44 92.89 92.89 92.91 92.40 91.42 91.87 91.87 90.94 90.63 95.87 95.56 95.71 95.87 95.56 95.41 95.41 96.02 96.02 96.02 95.87 95.87 95.87 95.87 95.72 96.02 99.39 100.00 99.85 95.25 94.17 94.17 92.97 92.96

gi|30524696|emb|AJ486961.1| 92.59 93.05 93.05 93.08 92.56 91.58 92.02 92.02 91.09 90.78 95.87 95.71 95.87 95.71 95.71 95.41 95.56 96.17 96.17 96.17 96.02 96.02 96.02 96.02 95.87 96.17 99.54 99.85 100.00 95.40 94.33 94.33 93.14 93.12

gi|212276600|gb|EU833652.1| 94.00 94.27 94.61 94.30 93.89 93.23 93.81 93.81 92.80 92.22 95.41 94.95 95.10 94.79 95.56 94.95 94.68 95.10 95.10 95.10 94.95 94.95 94.95 94.95 95.25 94.18 95.09 95.25 95.40 100.00 95.25 95.25 93.80 94.31

gi|30524701|emb|AJ486966.1| 94.61 94.85 94.85 94.86 94.56 93.58 93.26 93.57 92.94 92.33 94.33 94.18 94.49 94.18 94.49 93.87 93.72 94.33 94.33 94.33 94.18 94.18 94.18 94.18 94.49 92.96 94.48 94.17 94.33 95.25 100.00 100.00 94.14 93.62

gi|30524700|emb|AJ486965.1| 94.61 94.85 94.85 94.86 94.56 93.58 93.26 93.57 92.94 92.33 94.33 94.18 94.49 94.18 94.49 93.87 93.72 94.33 94.33 94.33 94.18 94.18 94.18 94.18 94.49 92.96 94.48 94.17 94.33 95.25 100.00 100.00 94.14 93.62

gi|122719225|gb|EF190315.1| 95.15 94.82 94.82 94.99 94.74 95.15 93.38 93.38 93.05 92.89 93.15 93.15 93.31 93.15 93.15 92.66 93.16 93.32 93.32 93.32 93.16 93.16 93.16 93.16 93.16 92.33 93.14 92.97 93.14 93.80 94.14 94.14 100.00 92.97

gi|19569130|gb|AF485064.1| 93.18 93.14 93.49 93.19 92.73 93.90 93.14 93.14 92.99 92.54 94.09 93.77 93.93 93.61 94.25 93.61 94.04 93.45 93.45 93.45 93.61 93.61 93.61 93.61 93.29 93.13 93.12 92.96 93.12 94.31 93.62 93.62 92.97 100.00

gi|298354255|dbj|AB509867.1| 91.19 92.73 93.08 92.78 92.81 89.20 91.83 91.55 92.92 91.55 94.74 94.43 94.74 94.43 94.74 94.43 92.88 93.50 93.50 93.50 93.81 93.81 93.81 93.81 93.19 93.50 93.81 93.81 93.81 94.41 95.34 95.34 93.40 97.31

gi|294818260|gb|GU939632.1| 91.98 92.44 92.80 92.65 92.17 91.18 92.08 91.82 91.25 91.09 93.04 92.74 92.89 92.58 92.89 92.89 92.65 92.89 92.89 92.89 93.04 93.04 93.04 93.04 92.74 92.89 92.88 92.72 92.88 93.14 92.58 92.58 92.43 94.85

gi|389548685|gb|JQ734547.1| 91.82 92.27 92.31 92.48 91.99 89.76 91.36 90.50 90.98 89.81 92.88 92.72 93.03 92.72 92.72 92.72 91.45 93.03 93.03 93.03 93.19 93.19 93.19 93.19 92.88 92.41 92.87 92.56 92.71 92.73 93.03 93.03 92.26 94.14

gi|346328552|gb|JF495038.1| 79.58 80.03 79.87 79.77 79.54 79.26 79.42 79.10 78.42 78.46 80.06 80.23 80.39 80.23 80.06 80.06 79.42 79.90 79.90 79.90 79.42 79.42 79.42 79.42 79.61 78.48 79.25 79.25 79.42 78.77 78.84 78.84 79.41 77.74

gi|346328551|gb|JF495037.1| 78.94 79.21 79.05 78.96 78.88 78.62 78.46 78.14 77.78 77.81 79.42 79.42 79.74 79.42 79.42 79.42 78.77 79.25 79.25 79.25 78.77 78.77 78.77 78.77 79.13 77.67 78.28 78.28 78.44 78.44 78.35 78.35 78.76 77.25

gi|346328550|gb|JF495036.1| 79.36 80.45 80.38 80.25 79.90 78.50 79.82 79.53 78.92 78.22 79.13 79.13 79.44 79.13 79.13 79.13 78.30 78.69 78.69 78.69 78.23 78.23 78.23 78.23 78.57 77.41 77.88 77.88 78.04 79.44 78.07 78.07 78.89 78.13

gi|346328549|gb|JF495035.1| 78.99 80.32 80.16 80.06 79.90 78.12 79.13 78.83 78.20 77.78 79.13 79.13 79.44 79.13 79.13 79.13 77.91 78.70 78.70 78.70 78.24 78.24 78.24 78.24 78.58 77.43 77.90 77.90 78.05 78.64 78.09 78.09 78.90 78.04

gi|22652915|gb|AF518603.1| 37.54 38.06 37.54 37.81 38.12 36.43 36.68 36.83 36.64 36.17 38.21 38.04 38.37 38.04 38.21 37.87 36.83 38.14 38.14 38.14 37.98 37.98 37.98 37.98 37.75 37.87 38.37 38.21 38.37 37.68 38.02 38.02 38.42 36.38

gi|38425339|gb|AY372216.1| 37.34 37.82 37.31 37.52 37.65 37.03 36.83 36.99 36.89 36.31 36.92 36.76 37.08 36.76 36.92 36.60 37.12 37.02 37.02 37.02 36.86 36.86 36.86 36.86 36.64 36.92 37.40 37.24 37.40 37.03 37.28 37.28 37.96 37.19

gi|346328535|gb|JF495021.1| 37.24 37.71 37.21 37.42 37.54 36.84 37.28 37.44 37.34 36.74 37.00 36.83 37.16 36.83 37.00 36.67 37.10 37.10 37.10 37.10 36.94 36.94 36.94 36.94 36.71 37.00 37.48 37.32 37.48 37.48 37.36 37.36 37.86 37.08

gi|346328533|gb|JF495019.1| 37.34 37.82 37.31 37.52 37.65 36.94 37.38 37.54 37.44 36.84 37.10 36.94 37.26 36.94 37.10 36.77 37.20 37.20 37.20 37.20 37.04 37.04 37.04 37.04 36.82 37.10 37.58 37.42 37.58 37.58 37.46 37.46 37.96 37.19

gi|346328534|gb|JF495020.1| 37.77 37.71 37.21 37.42 37.54 37.31 37.94 38.10 37.83 37.38 37.82 37.65 37.98 37.65 37.82 37.48 37.75 37.92 37.92 37.92 37.75 37.75 37.75 37.75 37.52 37.82 38.32 38.15 38.32 38.32 37.96 37.96 37.86 37.14

gi|38425335|gb|AY372212.1| 37.52 38.01 37.50 37.71 37.84 37.20 37.01 37.17 37.07 36.48 37.10 36.94 37.26 36.94 37.10 36.77 37.30 37.20 37.20 37.20 37.04 37.04 37.04 37.04 36.82 37.10 37.58 37.42 37.58 37.20 37.46 37.46 38.15 37.37

gi|38425337|gb|AY372214.1| 36.70 37.14 36.64 36.85 36.97 36.39 36.21 36.36 36.26 35.68 36.28 36.12 36.44 36.12 36.28 35.96 36.48 36.38 36.38 36.38 36.22 36.22 36.22 36.22 36.00 36.28 36.76 36.60 36.76 36.39 36.64 36.64 37.29 36.52

gi|2586020|gb|AF026665.1|AF026665 35.76 36.76 36.76 36.59 36.32 35.74 36.60 36.60 36.89 36.02 36.72 36.72 36.72 36.72 36.72 36.72 37.15 36.93 36.93 36.93 37.15 37.15 37.15 37.15 36.72 36.72 36.93 36.93 36.93 36.27 36.21 36.21 37.13 38.10

gi|6179393|emb|AJ237864.1| 43.36 43.36 43.16 43.16 43.05 43.16 42.11 42.50 43.47 42.50 43.33 43.14 43.33 43.14 43.53 43.14 43.84 43.64 43.64 43.64 43.84 43.84 43.84 43.84 43.95 44.12 44.12 44.12 44.31 44.23 43.75 43.75 44.03 42.75

gi|6179392|emb|AJ237863.1| 43.55 43.55 43.36 43.36 43.25 43.36 42.30 42.69 43.66 42.69 43.53 43.33 43.53 43.33 43.73 43.33 44.03 43.84 43.84 43.84 44.03 44.03 44.03 44.03 44.14 44.31 44.31 44.31 44.51 44.23 43.95 43.95 44.23 42.94

gi|6179394|emb|AJ237865.1| 43.16 43.16 42.97 42.97 42.86 42.97 41.91 42.30 43.27 42.30 43.14 42.94 43.14 42.94 43.33 42.94 43.64 43.44 43.44 43.44 43.64 43.64 43.64 43.64 43.75 43.92 43.92 43.92 44.12 43.84 43.55 43.55 43.84 42.55

Page 11: Trabajo Final Bioinformatica 2013

© Universidad Técnica Particular de Loja 2013 11

T(U) C % A % G % Total gi|122719228|gb|EF190318.1| Calvatia gigantea isolate CG13 30,9 21,8 23,0 24,2 673,0 gi|122719227|gb|EF190317.1| Calvatia gigantea isolate CG11 31,3 21,6 22,6 24,5 633,0 gi|122719226|gb|EF190316.1| Calvatia gigantea isolate CG17 31,0 21,9 22,8 24,4 636,0 gi|122719225|gb|EF190315.1| Calvatia gigantea isolate FrbJbP internal 31,8 21,7 23,0 23,6 623,0 gi|122719224|gb|EF190314.1| Calvatia gigantea isolate CG2 31,2 21,6 22,6 24,6 638,0 gi|122719223|gb|EF190313.1| Calvatia gigantea isolate FrbSob 30,9 22,1 22,3 24,7 611,0 gi|22652915|gb|AF518603.1| Calvatia gigantea strain DSH 96-032 23,4 20,1 26,2 30,2 884,0 gi|299033681|gb|HM237179.1| Calvatia gigantea strain 9-7A 18S 30,8 20,6 24,8 23,8 766,0 gi|48596658|emb|AJ617492.1| Calvatia gigantea partial 18S 30,4 21,4 23,5 24,7 718,0 gi|6179393|emb|AJ237864.1| Calvatia gigantea 18S rRNA gene, partial, strain R19/90 27,8 22,6 22,2 27,3 571,0 gi|2586020|gb|AF026665.1|AF026665 Calvatia gigantea 12S ribosomal 26,5 14,6 37,9 20,9 535,0 gi|30524974|emb|AJ486871.1| Calvatia fragilis ITS1, 5.8S rRNA gene and ITS2, from USA:South Dakota 31,5 21,4 24,0 23,1 654,0 gi|30524973|emb|AJ486870.1| Calvatia fragilis ITS1, 5.8S rRNA gene and ITS2, from Mexico 31,3 21,5 24,1 23,1 655,0 gi|30524699|emb|AJ486964.1| Calvatia fragilis partial ITS1, 5.8S rRNA gene and partial ITS2, country Ghana 30,8 22,2 24,2 22,7 652,0 gi|30524698|emb|AJ486963.1| Calvatia fragilis partial ITS1, 5.8S rRNA gene and partial ITS2, country Mongolia 30,9 21,7 24,0 23,3 653,0 gi|30524697|emb|AJ486962.1| Calvatia fragilis partial ITS1, 5.8S rRNA gene and partial ITS2, country Italy 31,2 21,7 24,0 23,0 653,0 gi|30524696|emb|AJ486961.1| Calvatia fragilis partial ITS1, 5.8S rRNA gene and partial ITS2, country Spain 31,2 21,7 24,0 23,1 654,0 gi|30524695|emb|AJ486960.1| Calvatia fragilis partial ITS1, 5.8S rRNA gene and partial ITS2, country Australia, Swan River 31,5 21,0 24,3 23,2 651,0 gi|30524694|emb|AJ486959.1| Calvatia fragilis partial ITS1, 5.8S rRNA gene and partial ITS2, country Argentina 31,7 21,0 24,2 23,1 653,0 gi|30524693|emb|AJ486958.1| Calvatia fragilis partial ITS1, 5.8S rRNA gene and partial ITS2, country Pakistan 31,6 21,0 24,3 23,0 651,0 gi|30524692|emb|AJ486957.1| Calvatia fragilis partial ITS1, 5.8S rRNA gene and partial ITS2, country USA 31,2 21,6 24,0 23,2 654,0 gi|48596659|emb|AJ617493.1| Calvatia fragilis partial 18S rRNA gene, ITS1, 5.8S rRNA gene, ITS2, and partial 28S rRNA gene, strain CFRO 30,6 21,1 24,9 23,5 712,0 gi|6179394|emb|AJ237865.1| Calvatia fragilis 18S rRNA gene, partial, strain CFRO 28,0 22,4 22,1 27,5 571,0 gi|30524971|emb|AJ486868.1| Calvatia cyathiformis var. cyathiformis ITS1, 5.8S rRNA gene and ITS2, from USA:Philadelphia 31,3 21,5 24,0 23,2 655,0 gi|30524970|emb|AJ486867.1| Calvatia cyathiformis var. cyathiformis ITS1, 5.8S rRNA gene and ITS2, from USA:South Carolina 31,3 21,5 24,0 23,2 655,0 gi|30524969|emb|AJ486866.1| Calvatia cyathiformis var. cyathiformis ITS1, 5.8S rRNA gene and ITS2, from USA:Oklahoma 31,3 21,5 24,0 23,2 655,0 gi|30524967|emb|AJ486864.1| Calvatia cyathiformis var. cyathiformis ITS1, 5.8S rRNA gene and ITS2, from France 31,3 21,5 24,1 23,1 655,0 gi|30524976|emb|AJ486873.1| Calvatia cyathiformis var. cyathiformis ITS1, 5.8S rRNA gene and ITS2, from Paraguay 31,3 21,5 24,1 23,1 655,0 gi|30524975|emb|AJ486872.1| Calvatia cyathiformis var. cyathiformis ITS1, 5.8S rRNA gene and ITS2, from Brazil 31,3 21,5 24,1 23,1 655,0 gi|30524968|emb|AJ486865.1| Calvatia cyathiformis var. cyathiformis ITS1, 5.8S rRNA gene and ITS2, from Paraguay 31,3 21,5 24,1 23,1 655,0 gi|30524701|emb|AJ486966.1| Calvatia chilensis partial ITS1, 5.8S rRNA gene and partial ITS2, country Argentina 31,0 22,2 23,9 22,9 658,0 gi|30524700|emb|AJ486965.1| Calvatia chilensis partial ITS1, 5.8S rRNA gene and partial ITS2, country Chile 31,0 22,2 23,9 22,9 658,0 gi|298354255|dbj|AB509867.1| Calvatia craniiformis gene for 5.8S 31,3 21,4 25,4 22,0 355,0 gi|294818260|gb|GU939632.1| Calvatia candida strain PB101 30,6 21,6 25,3 22,5 712,0 gi|30524972|emb|AJ486869.1| Calvatia cyathiformis var. crucibulum ITS1, 5.8S rRNA gene and ITS2, from Cuba 31,1 21,8 24,1 23,0 656,0 gi|212276600|gb|EU833652.1| Calvatia cf. leiospora AN014671 voucher AN014671 (ARIZ) 30,0 21,8 24,3 23,9 696,0 gi|225382603|gb|FJ772413.1| Calvatia fenzlii strain Jz01 18S 31,3 20,5 24,6 23,6 784,0 gi|6179392|emb|AJ237863.1| Calvatia complutensis 18S rRNA gene, partial, strain CCMD 27,8 22,6 22,1 27,5 571,0 gi|19569130|gb|AF485064.1| Calvatia rubro-flava 18S ribosomal RNA gene 31,3 20,2 25,1 23,4 672,0 gi|212276599|gb|EU833651.1| Calvatia bicolor voucher LMG756-58 (ARIZ) 30,2 21,8 25,2 22,8 762,0 gi|212276601|gb|EU833653.1| Calvatia pachydermica voucher AN014692 (ARIZ) 31,3 20,8 24,1 23,8 735,0 gi|389548685|gb|JQ734547.1| Calvatia holothurioides voucher LE 287408 29,8 20,4 26,7 23,2 855,0 gi|38425339|gb|AY372216.1| Barcheria willisiana specimen-voucher MEL2177563 25S 23,6 20,1 25,8 30,5 865,0 gi|38425335|gb|AY372212.1| Barcheria willisiana specimen-voucher BA1307 25S 23,6 20,1 25,8 30,5 865,0 gi|346328552|gb|JF495038.1| Barcheria willisiana voucher H7564 32,2 21,3 22,6 24,0 643,0 gi|346328551|gb|JF495037.1| Barcheria willisiana voucher H7518 31,5 21,9 22,3 24,3 645,0 gi|346328550|gb|JF495036.1| Barcheria willisiana voucher MEL2177563 31,2 21,7 23,2 23,9 699,0 gi|346328549|gb|JF495035.1| Barcheria willisiana voucher MEL269353 31,7 21,6 23,5 23,2 681,0 gi|346328535|gb|JF495021.1| Barcheria willisiana voucher MEL2177561 28S 23,5 20,0 26,0 30,6 851,0 gi|346328534|gb|JF495020.1| Barcheria willisiana voucher H7518 28S 23,3 19,8 26,1 30,7 827,0 gi|346328533|gb|JF495019.1| Barcheria willisiana voucher H7564 28S 23,5 20,0 25,9 30,6 852,0

Anexo 2: Composición de nucleótidos por cada especie

Anexo 3: Árbol filogenético

Page 12: Trabajo Final Bioinformatica 2013

Bioinformatic

12

Anexo 3: Árbol filogenético