B ioinform atics Alignment of biological sequences - databases and software
- COMPARISON - Multiple Sequences Alignment
-
Upload
neve-hoover -
Category
Documents
-
view
74 -
download
0
description
Transcript of - COMPARISON - Multiple Sequences Alignment
- COMPARISON -Multiple Sequences
Alignment
Multiple Sequence Alignment ?
• Usaha penjajaran (alignment) lebih dari satu sekuen• Berhubungan dengan penentuan hipotesis terhadap
beberapa sekuen, yaitu seberapa besar perubahan (evolusi) dari sekuen tersebut yang terjadi melalui proses substitusi, delesi, dan insersi pada residu-residu sekuen tersebut.
SEKUEN STRUKTUR FUNGSI
Program Multiple Alignment
Muscle T- Coffee Clustal
K-mer clustering, Progressive alignment
Progressive global and local
alignment
Progressive global alignment
Accurate Accurate Greedy
(Less Accurate)
Fast Slow Medium
Progressive Sequence Alignment
Input data sekuen
Input data Sekumpulan sekuen yang homolog (Share a common ancestor)
Input Sekuen yang homolog
Fasta format
Program multiple Alignment Clustal X
Hasil Multiple Alignment
• Perbedaan residu menunjukkan adanya subtitusi• Gap “-” adanya insersi atau delesi residu• Residu yang muncul di setiap sekuen ditandai dengan tanda bintang “ * ”• Tanda “ : ” berbeda residu, namun memiliki sifat fisikokimia (hydropathy) yang
sama
Sekuen Input
Residu hasil penjajaran
Posisi setiap residu
SubtitusiGap
Conserve Non Conserve
Kriteria dan arti dari Multiple Sequence Alignment
KRITERIA ARTINYA
Structure Similarity
Asam amino yang memiliki peran yang sama di setiap struktur berada dalam kolom yang sama. Program Structure Superposition
Evolutionary Similarity
Asam amino atau nukleotida yang memiliki sejarah ancestor yang sama dari setiap sekuen ditempatkan ditempat yang sama
Functional Similarity
Asam amino atau nukleotida yang memiliki fungsi yang sama berada dalam kolom yang sama
Sequence Similarity
•Asam amino yang berada dalam satu kolom adalah yang menghasilkan penjajaran dengan kesamaan (similarity) paling maksimal. •Ketika sekuen-sekuen berhubungan dekat, kesamaan struktur, evolusi, dan fungsi sama dengan kesamaan sekuen
- PREDIKSI -Filogenetika molekuler
Ilmu yang mempelajari estimasi atau konstruksi sejarah evolusi dari suatu organisme atau sekuen
Filogeni
Filogeni yang berdasarkan perbandingan data-data sekuen biologi molekuler (DNA atau Protein)
RootBranch (Edges) =
CabangBranch Length =
Tingkat perbedaan
TERMINOLOGI
Node: o Internal (Last Common Anchestor)o Terminal = Leafs (OTUs)
Outgroup
Gene TreeSpecies
Tree
Homolog = kesamaan yang diperoleh dari anchestor (nenek moyang) yang sama.
Ortolog = duplikasi ketika inang membelah, bersamaan dengan keseluruhan genom (vertically transmitted/ parent to offspring) gen X spesies A dengan gen X spesies B
Paralog =muncul karena duplikasi gen (multigene family) Gen X dengan Gen X’ Rentan misinterpretasi (karena hilangnya gen)
HOMOLOGY
30 November 2008
• Filogenetik cenderung tidak bias karena informasi yang digunakan adalah sekuen DNA atau protein
• Reason to do phylogenetic :– menentukan kekerabatan organisme,
pada bateri dengan sekuen 16s rRNA– menentukan fungsi suatu gen– menetukan asal usul gen– melihat persebaran organisme
(filogeografi)
30 November 2008
• DNA vs Protein, the hard choice?– jika organisme/gen berkerabat dekat atau
homologi > 70% DNA– Jika organisme/gen berkerabat jauh atau
homologi < 70% Protein• Dari mana Anda tahu nilai
homologinya?BLAST
• Pilihan Anda akan berpengaruh pada hasil Multiple Sequence Alignment
30 November 2008
• Kunci dari filogenetik yang baik Multiple Sequence Alignment (MSA) yang baik.
• Jika MSA Anda tidak cukup baik pohon filogenetik tidak dapat dipertanggungjawabkan
• Jika MSA Anda baik pohon filogenetik dapat dipertanggungjawabkan.
30 November 2008
• Metode rekonstruksi pohon filogenetik :– Distance based method :
Mengukur perbedaan basa/asam amino antara dua sekuen. Semakin kecil perbedaan berkerabat dekat. Contoh : Neighbor Joining (NJ)
– Sequence based method :rekonstruksi filogenetik berdasarkan perbedaan yang ada padaosisis tertentu dari sekuen DNA/protein. Contoh : Maximum Parsimony, Maximum Likelihood & Bayesian
• Semua metode dapat dipertanggungjawabkan
METHODS•Distance Matrix Methods (Clustering / Algoritmic Methode) UPGMA, NJ, Fitch•Discrete Data Methode (Tree Searching Methods) Parsimony, Maximum likelihood,
BayesianBOOTSTRAPPING (Di Uji
Kekokohannya)
30 November 2008
• Bagaimana membaca pohon filogenetik?
• Clade adalah pengelompokan utama pada pohon filogenetik
• Jarak antar Clade dilihat dengan membandingkan garis horizontal antar dua cabang dengan skala
Pohon filogenetik dengan metode NJ
30 November 2008
• Bagaimana membaca pohon filogenetik ?
• Spesies akan memiliki jarak genetik yang kecil
• Genus bakteri dengan beberapa spesies dicirikan dengan jarak genetik yang cukup jauh
Pohon filogenetik 16s rRNA dengan metode NJ
30 November 2008
• Jarak antar genus dicirikan dengan jarak genetik yang jauh
Pohon filogenetik 16s rRNA dengan metode NJ
BOOTSTRAPPING
30 November 2008
• Bootstraping adalah pengujian terhadap kestabilan pengelompokan pada pohon filogenetik kita
• Semakin tinggi nilai bootstraping semakin stabil pengelompokan dalam pohon filogenetik kita
Bootstraping pohon filogenetik 16s rRNA