18
Matrices de sustitución

Matrices de sustitución. Matrices PAM (Point- Accepted Mutation). Esta familia de matrices lista el cambio probable de un aminoácido por otro en secuencia

Embed Size (px)

Citation preview

Page 1: Matrices de sustitución. Matrices PAM (Point- Accepted Mutation). Esta familia de matrices lista el cambio probable de un aminoácido por otro en secuencia

Matrices de sustitución

Page 2: Matrices de sustitución. Matrices PAM (Point- Accepted Mutation). Esta familia de matrices lista el cambio probable de un aminoácido por otro en secuencia

Matrices PAM (Point-Accepted Mutation).

Esta familia de matrices lista el cambio probable de un aminoácido por otro en secuencia de proteínas homologas durante la evolución.

Cada matriz da el cambio esperado por un periodo dado.

Una unidad PAM es una medida arbitraria de divergencia evolutiva en la que se asume que el 1% de los aminoácidos han cambiado entre dos proteínas.

Los cambios que se observan entre proteínas homólogas son aquellos que no alteran seriamente la función de la proteína, es decir, son "aceptados" por la evolución.

Page 3: Matrices de sustitución. Matrices PAM (Point- Accepted Mutation). Esta familia de matrices lista el cambio probable de un aminoácido por otro en secuencia

Matrices PAM

Dayhoff et al. (1978) uso multiples alineamientos (sin gaps) de ciertas regiones conservadas de proteinas cercanamente relacionadas (71 groups of proteins, all in all 1572 changes.)

71 trees with 1572 accepted mutations, sequences with >85% identity

Page 4: Matrices de sustitución. Matrices PAM (Point- Accepted Mutation). Esta familia de matrices lista el cambio probable de un aminoácido por otro en secuencia

Matriz PAM

Estas secuencias similares fueron primero organizados en arboles filogeneticos.

Page 5: Matrices de sustitución. Matrices PAM (Point- Accepted Mutation). Esta familia de matrices lista el cambio probable de un aminoácido por otro en secuencia

Matriz PAMEl numero de cambios de cada aminoácido en cada otro aminoácido fueron luego contados.

Page 6: Matrices de sustitución. Matrices PAM (Point- Accepted Mutation). Esta familia de matrices lista el cambio probable de un aminoácido por otro en secuencia
Page 7: Matrices de sustitución. Matrices PAM (Point- Accepted Mutation). Esta familia de matrices lista el cambio probable de un aminoácido por otro en secuencia

Calculo para obtener el Log odds score por cambios entre Phe y Try en una

PAM 250

Page 8: Matrices de sustitución. Matrices PAM (Point- Accepted Mutation). Esta familia de matrices lista el cambio probable de un aminoácido por otro en secuencia
Page 9: Matrices de sustitución. Matrices PAM (Point- Accepted Mutation). Esta familia de matrices lista el cambio probable de un aminoácido por otro en secuencia
Page 10: Matrices de sustitución. Matrices PAM (Point- Accepted Mutation). Esta familia de matrices lista el cambio probable de un aminoácido por otro en secuencia
Page 11: Matrices de sustitución. Matrices PAM (Point- Accepted Mutation). Esta familia de matrices lista el cambio probable de un aminoácido por otro en secuencia

• Calculamos la frecuencia de cambio de F x Y 0.0021.

• Calculamos los valores de PAM250.• En PAM250 el valor de frecuencia de F x Y es 0.15.• Para construir nuestra MDM. • 0.15/0.04 =3.75 Log(3.75) = 0.57• 0.57 x 10 =5.7

Page 12: Matrices de sustitución. Matrices PAM (Point- Accepted Mutation). Esta familia de matrices lista el cambio probable de un aminoácido por otro en secuencia

• De la misma forma para Y x F.• 0.20/0.03 = 6.7 Log(6.7) = 0.83• 0.83 x 10 = 8.3

Calculamos el promedio de 5.7 y 8.3 = 7

Page 13: Matrices de sustitución. Matrices PAM (Point- Accepted Mutation). Esta familia de matrices lista el cambio probable de un aminoácido por otro en secuencia

MDM Mutation Data Matrix

Page 14: Matrices de sustitución. Matrices PAM (Point- Accepted Mutation). Esta familia de matrices lista el cambio probable de un aminoácido por otro en secuencia

Selección de PAMObjetivo.Detectar similaridad de secuencias.Premisa: El score de alineamiento sin gaps puede ser más alto, cuando se usa una matríz correcta

Base. Homología de proteínas (Distancia evolutiva)

PAM 1: 1 mutación cada 100aa

PAM 200 : 25% similaridadPAM120 : 40% similaridadPAM80 : 50% similaridadPAM60 : 60% similaridad

Page 15: Matrices de sustitución. Matrices PAM (Point- Accepted Mutation). Esta familia de matrices lista el cambio probable de un aminoácido por otro en secuencia

• BLOSUM (Blocks Amino Acid Substitution Matrices)Henikoff & Henikoff, 1992Basada en bloques de más de 2000 patrones de

aminoácidos conservados en aprox. 500proteínas.

Matríz: Ferecuencia de cambio observada en un grando y diverso número de proteínas.

Page 16: Matrices de sustitución. Matrices PAM (Point- Accepted Mutation). Esta familia de matrices lista el cambio probable de un aminoácido por otro en secuencia
Page 17: Matrices de sustitución. Matrices PAM (Point- Accepted Mutation). Esta familia de matrices lista el cambio probable de un aminoácido por otro en secuencia

Diferencias• PAM: Modelo evolutivo

– Basado en la extrapolación a partir de un corto periodo evolutivo.– Errores en la PAM 1 son magnificados hacia la PAM 250.– Asume que la tasa evolutiva es constante.– Todos los residuos son iguales.

• BLOSUM: basado en secuencias conservadas cortas (bloques)– Basado en run rango de periodos evolutivos– Cada matríz es construida separadamente

Page 18: Matrices de sustitución. Matrices PAM (Point- Accepted Mutation). Esta familia de matrices lista el cambio probable de un aminoácido por otro en secuencia

Similaridades

• Derivadas de pequeños grupos de secuencias al azar.

• Requiren secuencias alineadas para su construcción.

• Dependen del alineamiento global sin gaps.