PAM Margaret Dayhoff. Accepted Point Mutations accepted by natural selection.
-
Upload
manuela-prado-morales -
Category
Documents
-
view
259 -
download
0
Transcript of PAM Margaret Dayhoff. Accepted Point Mutations accepted by natural selection.
![Page 1: PAM Margaret Dayhoff. Accepted Point Mutations accepted by natural selection.](https://reader035.fdocuments.us/reader035/viewer/2022062217/5665b47e1a28abb57c91f409/html5/thumbnails/1.jpg)
PAM
Margaret Dayhoff
![Page 2: PAM Margaret Dayhoff. Accepted Point Mutations accepted by natural selection.](https://reader035.fdocuments.us/reader035/viewer/2022062217/5665b47e1a28abb57c91f409/html5/thumbnails/2.jpg)
Accepted Point Mutations
accepted by natural selection.
![Page 3: PAM Margaret Dayhoff. Accepted Point Mutations accepted by natural selection.](https://reader035.fdocuments.us/reader035/viewer/2022062217/5665b47e1a28abb57c91f409/html5/thumbnails/3.jpg)
Figura 1.
![Page 4: PAM Margaret Dayhoff. Accepted Point Mutations accepted by natural selection.](https://reader035.fdocuments.us/reader035/viewer/2022062217/5665b47e1a28abb57c91f409/html5/thumbnails/4.jpg)
Numbers of accepted point mutations
260
![Page 5: PAM Margaret Dayhoff. Accepted Point Mutations accepted by natural selection.](https://reader035.fdocuments.us/reader035/viewer/2022062217/5665b47e1a28abb57c91f409/html5/thumbnails/5.jpg)
Mutability of Amino Acids
![Page 6: PAM Margaret Dayhoff. Accepted Point Mutations accepted by natural selection.](https://reader035.fdocuments.us/reader035/viewer/2022062217/5665b47e1a28abb57c91f409/html5/thumbnails/6.jpg)
![Page 7: PAM Margaret Dayhoff. Accepted Point Mutations accepted by natural selection.](https://reader035.fdocuments.us/reader035/viewer/2022062217/5665b47e1a28abb57c91f409/html5/thumbnails/7.jpg)
Mutation probability matrix for the evolutionary distance of 1 PAM.
21
![Page 8: PAM Margaret Dayhoff. Accepted Point Mutations accepted by natural selection.](https://reader035.fdocuments.us/reader035/viewer/2022062217/5665b47e1a28abb57c91f409/html5/thumbnails/8.jpg)
![Page 9: PAM Margaret Dayhoff. Accepted Point Mutations accepted by natural selection.](https://reader035.fdocuments.us/reader035/viewer/2022062217/5665b47e1a28abb57c91f409/html5/thumbnails/9.jpg)
In this Matrix, the score for changing Phe for Tyr was 0.0021.
PAM250 = 0.15 0.15 was divided by the frequency
of Phe in the sequence data, 0.040 0.15/0.04 =3.75 Log(3.75) =
0.57 0.57 x 10 =5.7
![Page 10: PAM Margaret Dayhoff. Accepted Point Mutations accepted by natural selection.](https://reader035.fdocuments.us/reader035/viewer/2022062217/5665b47e1a28abb57c91f409/html5/thumbnails/10.jpg)
Similarly the Tyr to Phe 0.20/0.03 = 6.7 Log(6.7) = 0.83 0.83 x 10 = 8.3
The average of 5.7 and 8.3 is 7 The number entered in the log odds
table for changes between Phe and Tyr at 250 PAMs.
![Page 11: PAM Margaret Dayhoff. Accepted Point Mutations accepted by natural selection.](https://reader035.fdocuments.us/reader035/viewer/2022062217/5665b47e1a28abb57c91f409/html5/thumbnails/11.jpg)
PAM 250
![Page 12: PAM Margaret Dayhoff. Accepted Point Mutations accepted by natural selection.](https://reader035.fdocuments.us/reader035/viewer/2022062217/5665b47e1a28abb57c91f409/html5/thumbnails/12.jpg)
MATRICES BLOSUM Henikoff and Henikoff 1992
Matrices estadísticas se utilizan tanto para identificar las secuencias en la base de datos cómo para estimar su significancia biológica.
![Page 13: PAM Margaret Dayhoff. Accepted Point Mutations accepted by natural selection.](https://reader035.fdocuments.us/reader035/viewer/2022062217/5665b47e1a28abb57c91f409/html5/thumbnails/13.jpg)
Los algoritmos de alineamientos local identifican las regiones compartidas por dos secuencias que son más similares entre sí.
Entonces, dominios de enlace de calcio homólogos embebido en proteínas no homólogas , exones en una secuencia genómica de ADN si se alinea con sus secuencia de ARNm.
![Page 14: PAM Margaret Dayhoff. Accepted Point Mutations accepted by natural selection.](https://reader035.fdocuments.us/reader035/viewer/2022062217/5665b47e1a28abb57c91f409/html5/thumbnails/14.jpg)
"high-scoring segments pairs, HSPs".
Durante los procesos de búsqueda y extensión se hace uso de matrices de sustitución. Entonces las secuencias reportadas serán aquellas que posean los puntajes totales más altos ("maximal-scoring segment pair, MSP").
![Page 15: PAM Margaret Dayhoff. Accepted Point Mutations accepted by natural selection.](https://reader035.fdocuments.us/reader035/viewer/2022062217/5665b47e1a28abb57c91f409/html5/thumbnails/15.jpg)
BLOSUM (Block amino acid Substitution Matrices)
Sin modelo evolutivo. Bloques de secuencias. sin gaps que incluye
homólogos lejanos Basado en 2000 bloques de sec conservadas
de aa, perteneciente a 500 fam relacionadas Para BLOSUM n, las secuencias con identidad
> de n% se agrupan y cuentan como una sola. A mayor BLOSUM, menor distancia. Típicas: BLOSUM 62, 50, 30.
![Page 16: PAM Margaret Dayhoff. Accepted Point Mutations accepted by natural selection.](https://reader035.fdocuments.us/reader035/viewer/2022062217/5665b47e1a28abb57c91f409/html5/thumbnails/16.jpg)
![Page 17: PAM Margaret Dayhoff. Accepted Point Mutations accepted by natural selection.](https://reader035.fdocuments.us/reader035/viewer/2022062217/5665b47e1a28abb57c91f409/html5/thumbnails/17.jpg)
matrices log odds (logaritmo base 2) de las frecuencias de pares que se presentan en la columnas de los bloques analizados:
Sab = log (qab / еab)Frecuencia de ocurrencia de un aa se
encuentre en un par :pi = qii + Σ qij/2 i=j
![Page 18: PAM Margaret Dayhoff. Accepted Point Mutations accepted by natural selection.](https://reader035.fdocuments.us/reader035/viewer/2022062217/5665b47e1a28abb57c91f409/html5/thumbnails/18.jpg)
Frecuencia esperada de que los pares ocurran juntos:
ε = pi *pi si i=j ε = 2pi*pj si i=j
![Page 19: PAM Margaret Dayhoff. Accepted Point Mutations accepted by natural selection.](https://reader035.fdocuments.us/reader035/viewer/2022062217/5665b47e1a28abb57c91f409/html5/thumbnails/19.jpg)
Calculo de una matriz BLOSUM, ejemplo tomado y modificado de Henikoff and
Henikoff 1992 GHGKKVADADLL AHGKKVLGADGL GHGKKVADADLL AHGKKVLGADGL GHGKKVADADLL AHGKKVLGSDGL GHGKKVADADLL AHGKKVLGADGL GHGKKVADADLL AHGKKVLGADGL
bloque de secuencias (sección de una alineación local que no posee espacios)
calcula el número de pares posibles en una columna como no se conoce el aminoácido ancestral, se deben tomar todos los pares posibles. En el caso del ejemplo, existen 36 pares para AA (fAA) y 9 para SA (fAS).
![Page 20: PAM Margaret Dayhoff. Accepted Point Mutations accepted by natural selection.](https://reader035.fdocuments.us/reader035/viewer/2022062217/5665b47e1a28abb57c91f409/html5/thumbnails/20.jpg)
Para calcular los valores de una matriz BLOSUM, necesitamos las frecuencias de los pares qab (ver formula), que en este caso qAA = fAA/(fAA+ fAS) = 36/36+9 = 0.8 y qAS = fAS/(fAA+ fAS) = 9/36+9 = 0.2
La frecuencia de que A se encuentre en par. pA = (qAA + qAS/2) = 0.8 + 0.2/2 = 0.9 y la frecuencia esperada de S es pS = (qAS/2) = 0.2/2 = 0.1
Así mismo, necesitamos conocer la frecuencia esperada de los pares AA y AS, la cual se calcula: eAA = PA x PA = 0.9 x 0.9 = 0.81 y eAS = 2 x PS x PA = 2 x 0.1 x 0.9 = 0.18
![Page 21: PAM Margaret Dayhoff. Accepted Point Mutations accepted by natural selection.](https://reader035.fdocuments.us/reader035/viewer/2022062217/5665b47e1a28abb57c91f409/html5/thumbnails/21.jpg)
Por último, calculamos el logaritmo (base 2) del radio de las frecuencias (qab / eab) y se multiplica por dos para trabajar con unidades de ½ de bit. En el ejemplo, SAA = log2 (qAA/eAA) = log2 (0.80/0.81) = -0.04 y SAS = log2 (qAS/eAS) = log2 (0.2/0.18) = 0.30
![Page 22: PAM Margaret Dayhoff. Accepted Point Mutations accepted by natural selection.](https://reader035.fdocuments.us/reader035/viewer/2022062217/5665b47e1a28abb57c91f409/html5/thumbnails/22.jpg)
![Page 23: PAM Margaret Dayhoff. Accepted Point Mutations accepted by natural selection.](https://reader035.fdocuments.us/reader035/viewer/2022062217/5665b47e1a28abb57c91f409/html5/thumbnails/23.jpg)
El resultado de todo esto es que, en BLOSUM62 vemos que D -> E (aspártico -> glutámico, ambos ácidos) tiene una puntuación positiva de +2, mientras que D -> L (aspártico -> leucina, ácido a hidrofóbico) tiene un valor negativo de -4. Esto nos indica que en los alineamientos utilizados para construir la matriz BLOSUM62, se observó con mayor frecuencia de la esperada el cambio D->E, no así el cambio D->L.
![Page 24: PAM Margaret Dayhoff. Accepted Point Mutations accepted by natural selection.](https://reader035.fdocuments.us/reader035/viewer/2022062217/5665b47e1a28abb57c91f409/html5/thumbnails/24.jpg)
Algunos de los residuos cuya conservación parece más importante son el W (11), la C (9), la H (8), la P (7), etc. (diagonales)
![Page 25: PAM Margaret Dayhoff. Accepted Point Mutations accepted by natural selection.](https://reader035.fdocuments.us/reader035/viewer/2022062217/5665b47e1a28abb57c91f409/html5/thumbnails/25.jpg)
FILTROS secuencias de baja complejidad (filtro SEG para
aminoácidos y filtro DUST para nucleótidos: enmascara con X
secuencias repetitivas (filtro XNU): se aplica a secuencias con cortas repeticiones.
secuencias de coiled-coils (filtro COILS): se aplica a secuencias de coiled-coils. Éstas, al tener una periodicidad (suelen tener una Leu o una Ile cada 7 residuos) pueden dar buenas puntuaciones con otras proteínas que también adopten coiled-coils, sin que por ello compartan un origen
evolutivo común (sin que sean homólogas).
![Page 26: PAM Margaret Dayhoff. Accepted Point Mutations accepted by natural selection.](https://reader035.fdocuments.us/reader035/viewer/2022062217/5665b47e1a28abb57c91f409/html5/thumbnails/26.jpg)
Extras… valor por omisión del programa Blastn es de 11 letras
excluir homologos que divergen moderadamente, azar
FASTA que les permite ignorar (i.e. que no aparezcan en el output) secuencias altamente similares al query.
ktup en FASTA es el parámetro que indica el tamaño de la palabra utilizada en esta búsqueda inicial
FASTA utiliza por default ktup=2, mientras que BLAST utiliza ktup=3.
FASTA sólo considera identidades respecto a la palabra, mientras que BLAST utiliza identidades y sustituciones conservativas
![Page 27: PAM Margaret Dayhoff. Accepted Point Mutations accepted by natural selection.](https://reader035.fdocuments.us/reader035/viewer/2022062217/5665b47e1a28abb57c91f409/html5/thumbnails/27.jpg)
Por default, BLAST filtra secuencias de baja complejidad o repeticiones. FASTA no! afectar la capacidad de discriminar falsos positivos
![Page 28: PAM Margaret Dayhoff. Accepted Point Mutations accepted by natural selection.](https://reader035.fdocuments.us/reader035/viewer/2022062217/5665b47e1a28abb57c91f409/html5/thumbnails/28.jpg)
Heurísticas de BLAST y FASTA Estos métodos son muy rápidos. Básicamente
utilizan los siguientes "truquillos":
tablas de dispersión: en lugar de representar una secuencia como tal, utilizan una tabla tal que:
posición : 12345678901 secuencia X: TCAGACGATTG
Tabla de disperisón de X: A 3, 5, 8 C 2, 6 G 4, 7, 11 T 1, 9, 10