CENTER FOR BIOLOGICAL SEQUENCE ANALYSIS Consensus Trees Anders Gorm Pedersen Molecular Evolution...
-
date post
21-Dec-2015 -
Category
Documents
-
view
223 -
download
0
Transcript of CENTER FOR BIOLOGICAL SEQUENCE ANALYSIS Consensus Trees Anders Gorm Pedersen Molecular Evolution...
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Consensus Trees
Anders Gorm PedersenAnders Gorm Pedersen
Molecular Evolution GroupMolecular Evolution Group
Center for Biological Sequence AnalysisCenter for Biological Sequence Analysis
Technical University of DenmarkTechnical University of Denmark
[email protected]@cbs.dtu.dk
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Strict Consensus Tree
Hu Ch Go Or Gi Hu Ch Go Or Gi
Tree 1 Tree 3
Hu Ch Go Or Gi
Tree 2
Hu Ch Go Or Gi
Strict consensus
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Majority Rule Consensus Tree
Hu Ch Go Or Gi Hu Ch Go Or Gi
Tree 1 Tree 3
Majority rule consensus
Hu Ch Go Or Gi
Tree 2
Hu Ch Go Or Gi
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Majority Rule Consensus Tree
A
E
C
F
B
D
C
A E
B
D
FA
E
F
D
B
C
A
E
B
C
DF
C
E
A
B
D
F
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Majority Rule Consensus Tree
A
E
C
F
B
D
C
A E
B
D
FA
E
F
D
B
C
A
E
B
C
DF
C
E
A
B
D
F
AA BB CC DD EE FF CountCount
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Majority Rule Consensus Tree
A
E
C
F
B
D
C
A E
B
D
FA
E
F
D
B
C
A
E
B
C
DF
C
E
A
B
D
F
AA BB CC DD EE FF CountCount
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Majority Rule Consensus Tree
A
E
C
F
B
D
C
A E
B
D
FA
E
F
D
B
C
A
E
B
C
DF
C
E
A
B
D
F
AA BB CC DD EE FF CountCount
** -- -- -- ** --
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Majority Rule Consensus Tree
A
E
C
F
B
D
C
A E
B
D
FA
E
F
D
B
C
A
E
B
C
DF
C
E
A
B
D
F
AA BB CC DD EE FF CountCount
** -- -- -- ** -- II
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Majority Rule Consensus Tree
A
E
C
F
B
D
C
A E
B
D
FA
E
F
D
B
C
A
E
B
C
DF
C
E
A
B
D
F
AA BB CC DD EE FF CountCount
** -- -- -- ** -- II
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Majority Rule Consensus Tree
A
E
C
F
B
D
C
A E
B
D
FA
E
F
D
B
C
A
E
B
C
DF
C
E
A
B
D
F
AA BB CC DD EE FF CountCount
** -- -- -- ** -- II
** -- ** -- ** --
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Majority Rule Consensus Tree
A
E
C
F
B
D
C
A E
B
D
FA
E
F
D
B
C
A
E
B
C
DF
C
E
A
B
D
F
AA BB CC DD EE FF CountCount
** -- -- -- ** -- II
** -- ** -- ** -- II
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Majority Rule Consensus Tree
A
E
C
F
B
D
C
A E
B
D
FA
E
F
D
B
C
A
E
B
C
DF
C
E
A
B
D
F
AA BB CC DD EE FF CountCount
** -- -- -- ** -- II
** -- ** -- ** -- II
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Majority Rule Consensus Tree
A
E
C
F
B
D
C
A E
B
D
FA
E
F
D
B
C
A
E
B
C
DF
C
E
A
B
D
F
AA BB CC DD EE FF CountCount
** -- -- -- ** -- II
** -- ** -- ** -- II
** -- ** -- ** ** II
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Majority Rule Consensus Tree
A
E
C
F
B
D
C
A E
B
D
FA
E
F
D
B
C
A
E
B
C
DF
C
E
A
B
D
F
AA BB CC DD EE FF CountCount
** -- -- -- ** -- II
** -- ** -- ** -- II
** -- ** -- ** ** II
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Majority Rule Consensus Tree
A
E
C
F
B
D
C
A E
B
D
FA
E
F
D
B
C
A
E
B
C
DF
C
E
A
B
D
F
AA BB CC DD EE FF CountCount
** -- -- -- ** -- II
** -- ** -- ** -- II
** -- ** -- ** ** II
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Majority Rule Consensus Tree
A
E
C
F
B
D
C
A E
B
D
FA
E
F
D
B
C
A
E
B
C
DF
C
E
A
B
D
F
AA BB CC DD EE FF CountCount
** -- -- -- ** -- II
** -- ** -- ** -- II
** -- ** -- ** ** II
** -- ** -- -- -- II
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Majority Rule Consensus Tree
A
E
C
F
B
D
C
A E
B
D
FA
E
F
D
B
C
A
E
B
C
DF
C
E
A
B
D
F
AA BB CC DD EE FF CountCount
** -- -- -- ** -- II
** -- ** -- ** -- II
** -- ** -- ** ** II
** -- ** -- -- -- II
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Majority Rule Consensus Tree
A
E
C
F
B
D
C
A E
B
D
FA
E
F
D
B
C
A
E
B
C
DF
C
E
A
B
D
F
AA BB CC DD EE FF CountCount
** -- -- -- ** -- II
** -- ** -- ** -- II
** -- ** -- ** ** II
** -- ** -- -- -- II
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Majority Rule Consensus Tree
A
E
C
F
B
D
C
A E
B
D
FA
E
F
D
B
C
A
E
B
C
DF
C
E
A
B
D
F
AA BB CC DD EE FF CountCount
** -- -- -- ** -- II
** -- ** -- ** -- II
** -- ** -- ** ** II
** -- ** -- -- -- II
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Majority Rule Consensus Tree
A
E
C
F
B
D
C
A E
B
D
FA
E
F
D
B
C
A
E
B
C
DF
C
E
A
B
D
F
AA BB CC DD EE FF CountCount
** -- -- -- ** -- II
** -- ** -- ** -- IIII
** -- ** -- ** ** II
** -- ** -- -- -- II
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Majority Rule Consensus Tree
A
E
C
F
B
D
C
A E
B
D
FA
E
F
D
B
C
A
E
B
C
DF
C
E
A
B
D
F
AA BB CC DD EE FF CountCount
** -- -- -- ** -- II
** -- ** -- ** -- IIII
** -- ** -- ** ** II
** -- ** -- -- -- II
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Majority Rule Consensus Tree
A
E
C
F
B
D
C
A E
B
D
FA
E
F
D
B
C
A
E
B
C
DF
C
E
A
B
D
F
AA BB CC DD EE FF CountCount
** -- -- -- ** -- II
** -- ** -- ** -- IIII
** -- ** -- ** ** II
** -- ** -- -- -- II
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Majority Rule Consensus Tree
A
E
C
F
B
D
C
A E
B
D
FA
E
F
D
B
C
A
E
B
C
DF
C
E
A
B
D
F
AA BB CC DD EE FF CountCount
** -- -- -- ** -- II
** -- ** -- ** -- IIII
** -- ** -- ** ** II
** -- ** -- -- -- II
** ** ** -- ** -- II
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Majority Rule Consensus Tree
A
E
C
F
B
D
C
A E
B
D
FA
E
F
D
B
C
A
E
B
C
DF
C
E
A
B
D
F
AA BB CC DD EE FF CountCount
** -- -- -- ** -- II
** -- ** -- ** -- IIII
** -- ** -- ** ** II
** -- ** -- -- -- II
** ** ** -- ** -- II
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Majority Rule Consensus Tree
A
E
C
F
B
D
C
A E
B
D
FA
E
F
D
B
C
A
E
B
C
DF
C
E
A
B
D
F
AA BB CC DD EE FF CountCount
** -- -- -- ** -- IIII
** -- ** -- ** -- IIII
** -- ** -- ** ** II
** -- ** -- -- -- II
** ** ** -- ** -- II
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Majority Rule Consensus Tree
A
E
C
F
B
D
C
A E
B
D
FA
E
F
D
B
C
A
E
B
C
DF
C
E
A
B
D
F
AA BB CC DD EE FF CountCount
** -- -- -- ** -- IIII
** -- ** -- ** -- IIII
** -- ** -- ** ** II
** -- ** -- -- -- II
** ** ** -- ** -- II
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Majority Rule Consensus Tree
A
E
C
F
B
D
C
A E
B
D
FA
E
F
D
B
C
A
E
B
C
DF
C
E
A
B
D
F
AA BB CC DD EE FF CountCount
** -- -- -- ** -- IIII
** -- ** -- ** -- IIII
** -- ** -- ** ** II
** -- ** -- -- -- II
** ** ** -- ** -- II
** -- -- -- ** ** II
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Majority Rule Consensus Tree
A
E
C
F
B
D
C
A E
B
D
FA
E
F
D
B
C
A
E
B
C
DF
C
E
A
B
D
F
AA BB CC DD EE FF CountCount
** -- -- -- ** -- IIII
** -- ** -- ** -- IIII
** -- ** -- ** ** II
** -- ** -- -- -- II
** ** ** -- ** -- II
** -- -- -- ** ** II
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Majority Rule Consensus Tree
A
E
C
F
B
D
C
A E
B
D
FA
E
F
D
B
C
A
E
B
C
DF
C
E
A
B
D
F
AA BB CC DD EE FF CountCount
** -- -- -- ** -- IIII
** -- ** -- ** -- IIII
** -- ** -- ** ** II
** -- ** -- -- -- II
** ** ** -- ** -- II
** -- -- -- ** ** II
** -- -- ** ** ** II
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Majority Rule Consensus Tree
A
E
C
F
B
D
C
A E
B
D
FA
E
F
D
B
C
A
E
B
C
DF
C
E
A
B
D
F
AA BB CC DD EE FF CountCount
** -- -- -- ** -- IIII
** -- ** -- ** -- IIII
** -- ** -- ** ** II
** -- ** -- -- -- II
** ** ** -- ** -- II
** -- -- -- ** ** II
** -- -- ** ** ** II
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Majority Rule Consensus Tree
A
E
C
F
B
D
C
A E
B
D
FA
E
F
D
B
C
A
E
B
C
DF
C
E
A
B
D
F
AA BB CC DD EE FF CountCount
** -- -- -- ** -- IIII
** -- ** -- ** -- IIII
** -- ** -- ** ** II
** -- ** -- -- -- II
** ** ** -- ** -- II
** -- -- -- ** ** II
** -- -- ** ** ** II
-- -- ** -- ** -- II
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Majority Rule Consensus Tree
A
E
C
F
B
D
C
A E
B
D
FA
E
F
D
B
C
A
E
B
C
DF
C
E
A
B
D
F
AA BB CC DD EE FF CountCount
** -- -- -- ** -- IIII
** -- ** -- ** -- IIII
** -- ** -- ** ** II
** -- ** -- -- -- II
** ** ** -- ** -- II
** -- -- -- ** ** II
** -- -- ** ** ** II
-- -- ** -- ** -- II
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Majority Rule Consensus Tree
A
E
C
F
B
D
C
A E
B
D
FA
E
F
D
B
C
A
E
B
C
DF
C
E
A
B
D
F
AA BB CC DD EE FF CountCount
** -- -- -- ** -- IIII
** -- ** -- ** -- IIIIII
** -- ** -- ** ** II
** -- ** -- -- -- II
** ** ** -- ** -- II
** -- -- -- ** ** II
** -- -- ** ** ** II
-- -- ** -- ** -- II
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Majority Rule Consensus Tree
A
E
C
F
B
D
C
A E
B
D
FA
E
F
D
B
C
A
E
B
C
DF
C
E
A
B
D
F
AA BB CC DD EE FF CountCount
** -- -- -- ** -- IIII
** -- ** -- ** -- IIIIII
** -- ** -- ** ** II
** -- ** -- -- -- II
** ** ** -- ** -- II
** -- -- -- ** ** II
** -- -- ** ** ** II
-- -- ** -- ** -- II
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Majority Rule Consensus Tree
A
E
C
F
B
D
C
A E
B
D
FA
E
F
D
B
C
A
E
B
C
DF
C
E
A
B
D
F
AA BB CC DD EE FF CountCount
** -- -- -- ** -- IIII
** -- ** -- ** -- IIIIII
** -- ** -- ** ** II
** -- ** -- -- -- II
** ** ** -- ** -- IIII
** -- -- -- ** ** II
** -- -- ** ** ** II
-- -- ** -- ** -- II
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Majority Rule Consensus Tree
A
E
C
F
B
D
C
A E
B
D
FA
E
F
D
B
C
A
E
B
C
DF
C
E
A
B
D
F
AA BB CC DD EE FF CountCount
** -- -- -- ** -- IIII
** -- ** -- ** -- IIIIII
** -- ** -- ** ** II
** -- ** -- -- -- II
** ** ** -- ** -- IIII
** -- -- -- ** ** II
** -- -- ** ** ** II
-- -- ** -- ** -- II
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Majority Rule Consensus Tree
A
E
C
F
B
D
C
A E
B
D
FA
E
F
D
B
C
A
E
B
C
DF
C
E
A
B
D
F
AA BB CC DD EE FF CountCount
** -- -- -- ** -- IIIIII
** -- ** -- ** -- IIIIII
** -- ** -- ** ** II
** -- ** -- -- -- II
** ** ** -- ** -- IIII
** -- -- -- ** ** II
** -- -- ** ** ** II
-- -- ** -- ** -- II
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Majority Rule Consensus Tree
A
E
C
F
B
D
C
A E
B
D
FA
E
F
D
B
C
A
E
B
C
DF
C
E
A
B
D
F
AA BB CC DD EE FF CountCount
** -- -- -- ** -- IIIIII
** -- ** -- ** -- IIIIII
** -- ** -- ** ** II
** -- ** -- -- -- II
** ** ** -- ** -- IIII
** -- -- -- ** ** II
** -- -- ** ** ** II
-- -- ** -- ** -- II
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Majority Rule Consensus Tree
A
E
C
F
B
D
C
A E
B
D
FA
E
F
D
B
C
A
E
B
C
DF
C
E
A
B
D
F
AA BB CC DD EE FF CountCount
** -- -- -- ** -- IIIIII
** -- ** -- ** -- IIIIII
** -- ** -- ** ** II
** -- ** -- -- -- II
** ** ** -- ** -- IIIIII
** -- -- -- ** ** II
** -- -- ** ** ** II
-- -- ** -- ** -- II
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Majority Rule Consensus Tree
A
E
C
F
B
D
C
A E
B
D
FA
E
F
D
B
C
A
E
B
C
DF
C
E
A
B
D
F
AA BB CC DD EE FF CountCount
** -- -- -- ** -- IIIIII
** -- ** -- ** -- IIIIII
** -- ** -- ** ** II
** -- ** -- -- -- II
** ** ** -- ** -- IIIIII
** -- -- -- ** ** II
** -- -- ** ** ** II
-- -- ** -- ** -- II
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Majority Rule Consensus Tree
A
E
C
F
B
D
C
A E
B
D
FA
E
F
D
B
C
A
E
B
C
DF
C
E
A
B
D
F
AA BB CC DD EE FF CountCount
** -- -- -- ** -- IIIIII
** -- ** -- ** -- IIIIII
** -- ** -- ** ** II
** -- ** -- -- -- II
** ** ** -- ** -- IIIIII
** -- -- -- ** ** II
** -- -- ** ** ** IIII
-- -- ** -- ** -- II
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Majority Rule Consensus Tree
AA BB CC DD EE FF CountCount
** -- -- -- ** -- IIIIII
** -- ** -- ** -- IIIIII
** -- ** -- ** ** II
** -- ** -- -- -- II
** ** ** -- ** -- IIIIII
** -- -- -- ** ** II
** -- -- ** ** ** IIII
-- -- ** -- ** -- II
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Majority Rule Consensus Tree
AA BB CC DD EE FF FreqFreq
** -- -- -- ** -- 6060
** -- ** -- ** -- 6060
** -- ** -- ** ** 2020
** -- ** -- -- -- 2020
** ** ** -- ** -- 6060
** -- -- -- ** ** 2020
** -- -- ** ** ** 4040
-- -- ** -- ** -- 2020
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Majority Rule Consensus Tree
AA BB CC DD EE FF FreqFreq
** -- ** -- ** -- 6060
** -- -- -- ** -- 6060
** ** ** -- ** -- 6060
** -- -- ** ** ** 4040
** -- ** -- ** ** 2020
** -- ** -- -- -- 2020
** -- -- -- ** ** 2020
-- -- ** -- ** -- 2020
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Majority Rule Consensus Tree
AA BB CC DD EE FF FreqFreq
** -- ** -- ** -- 6060
** -- -- -- ** -- 6060
** ** ** -- ** -- 6060
** -- -- ** ** ** 4040
** -- ** -- ** ** 2020
** -- ** -- -- -- 2020
** -- -- -- ** ** 2020
-- -- ** -- ** -- 2020
E
A
B
D
F
C
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Majority Rule Consensus Tree
AA BB CC DD EE FF FreqFreq
** -- ** -- ** -- 6060
** -- -- -- ** -- 6060
** ** ** -- ** -- 6060
** -- -- ** ** ** 4040
** -- ** -- ** ** 2020
** -- ** -- -- -- 2020
** -- -- -- ** ** 2020
-- -- ** -- ** -- 2020
E
A
B
D
F
C
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Majority Rule Consensus Tree
AA BB CC DD EE FF FreqFreq
** -- ** -- ** -- 6060
** -- -- -- ** -- 6060
** ** ** -- ** -- 6060
** -- -- ** ** ** 4040
** -- ** -- ** ** 2020
** -- ** -- -- -- 2020
** -- -- -- ** ** 2020
-- -- ** -- ** -- 2020
E
A
B
D
F
C
60
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Majority Rule Consensus Tree
AA BB CC DD EE FF FreqFreq
** -- ** -- ** -- 6060
** -- -- -- ** -- 6060
** ** ** -- ** -- 6060
** -- -- ** ** ** 4040
** -- ** -- ** ** 2020
** -- ** -- -- -- 2020
** -- -- -- ** ** 2020
-- -- ** -- ** -- 2020
E
A
B
D
F
C
60
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Majority Rule Consensus Tree
E
A
B
D
F
C
60 60
AA BB CC DD EE FF FreqFreq
** -- ** -- ** -- 6060
** -- -- -- ** -- 6060
** ** ** -- ** -- 6060
** -- -- ** ** ** 4040
** -- ** -- ** ** 2020
** -- ** -- -- -- 2020
** -- -- -- ** ** 2020
-- -- ** -- ** -- 2020
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Majority Rule Consensus Tree
AA BB CC DD EE FF FreqFreq
** -- ** -- ** -- 6060
** -- -- -- ** -- 6060
** ** ** -- ** -- 6060
** -- -- ** ** ** 4040
** -- ** -- ** ** 2020
** -- ** -- -- -- 2020
** -- -- -- ** ** 2020
-- -- ** -- ** -- 2020
E
A
B
D
F
C
60 60
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Majority Rule Consensus Tree
AA BB CC DD EE FF FreqFreq
** -- ** -- ** -- 6060
** -- -- -- ** -- 6060
** ** ** -- ** -- 6060
** -- -- ** ** ** 4040
** -- ** -- ** ** 2020
** -- ** -- -- -- 2020
** -- -- -- ** ** 2020
-- -- ** -- ** -- 2020
E
A
B
D
F
C
60 60 60
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Majority Rule Consensus Tree
AA BB CC DD EE FF FreqFreq
** -- ** -- ** -- 6060
** -- -- -- ** -- 6060
** ** ** -- ** -- 6060
** -- -- ** ** ** 4040
** -- ** -- ** ** 2020
** -- ** -- -- -- 2020
** -- -- -- ** ** 2020
-- -- ** -- ** -- 2020
E
A
B
D
F
C
60 60 60
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Majority Rule Consensus Tree
AA BB CC DD EE FF FreqFreq
** -- ** -- ** -- 6060
** -- -- -- ** -- 6060
** ** ** -- ** -- 6060
** -- -- ** ** ** 4040
** -- ** -- ** ** 2020
** -- ** -- -- -- 2020
** -- -- -- ** ** 2020
-- -- ** -- ** -- 2020
E
A
B
D
F
C
60 60 60
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Majority Rule Consensus Tree
AA BB CC DD EE FF FreqFreq
** -- ** -- ** -- 6060
** -- -- -- ** -- 6060
** ** ** -- ** -- 6060
** -- -- ** ** ** 4040
** -- ** -- ** ** 2020
** -- ** -- -- -- 2020
** -- -- -- ** ** 2020
-- -- ** -- ** -- 2020
E
A
B
D
F
C
60 60 60
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Majority Rule Consensus Tree
AA BB CC DD EE FF FreqFreq
** -- ** -- ** -- 6060
** -- -- -- ** -- 6060
** ** ** -- ** -- 6060
** -- -- ** ** ** 4040
** -- ** -- ** ** 2020
** -- ** -- -- -- 2020
** -- -- -- ** ** 2020
-- -- ** -- ** -- 2020
E
A
B
D
F
C
60 60 60
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Majority Rule Consensus Tree
AA BB CC DD EE FF FreqFreq
** -- ** -- ** -- 6060
** -- -- -- ** -- 6060
** ** ** -- ** -- 6060
** -- -- ** ** ** 4040
** -- ** -- ** ** 2020
** -- ** -- -- -- 2020
** -- -- -- ** ** 2020
-- -- ** -- ** -- 2020
E
A
B
D
F
C
60 60 60
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Majority Rule Consensus Tree
E
A
B
D
F
C
60 60 60
A
E
C
F
B
D
C
A E
B
D
FA
E
F
D
B
C
A
E
B
C
DF
C
E
A
B
D
F
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Ancestral Reconstruction
Anders Gorm PedersenAnders Gorm Pedersen
Molecular Evolution GroupMolecular Evolution Group
Center for Biological Sequence AnalysisCenter for Biological Sequence Analysis
Technical University of DenmarkTechnical University of Denmark
[email protected]@cbs.dtu.dk
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Sankoff: length of 4 possible subtrees starting at internal node?
C A C A G
AA CC GG TT
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Sankoff: length of subtree having nucleotide “A” at internal node
C A
11
1 0
TTGGCCAA
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Sankoff: length of subtree having nucleotide “C” at internal node
C A
11 11
0 1
TTGGCCAA
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
11 11 22
1 1
C A
Sankoff: length of subtree having nucleotide “G” at internal node
TTGGCCAA
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
11 11 22 22
1 1
C A
Sankoff: length of subtree having nucleotide “T” at internal node
TTGGCCAA
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
C A C A G
11 11 22 22
Sankoff: length of 4 possible subtrees starting at internal node?
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
11 11 22 2211 22 11 22
C A C A G
Sankoff: length of 4 possible subtrees starting at internal node?
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
11 11 22 2211 22 11 22
AA
C A C A G
Sankoff: length of shortest possible subtree having “A” at internal node?
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
11 11 22 2211 22 11 22
AA
C A C A G
Sankoff: length of shortest possible subtree having “A” at internal node?
1
0
length of subtree = 1+0+1 = 2
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
11 11 22 2211 22 11 22
AA
C A C A G
Sankoff: length of shortest possible subtree having “A” at internal node?
1
1
length of subtree = 1+1+2 = 4
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
11 11 22 2211 22 11 22
AA
C A C A G
Sankoff: length of shortest possible subtree having “A” at internal node?
1
1
length of subtree = 1+1+1 = 3
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
11 11 22 2211 22 11 22
AA
C A C A G
Sankoff: length of shortest possible subtree having “A” at internal node?
1
1
length of subtree = 1+1+2 = 4
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
11 11 22 2211 22 11 22
AA
C A C A G
Sankoff: length of shortest possible subtree having “A” at internal node?
1
0
length of subtree = 1+0+1 = 2
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
11 11 22 2211 22 11 22
22
C A C A G
Ancestral Reconstruction Step I:Keep Track of Shortest Subtrees
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Ancestral Reconstruction Step I:Keep Track of Shortest Subtrees
11 11 22 2211 22 11 22
22 22
C A C A G
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Ancestral Reconstruction Step I:Keep Track of Shortest Subtrees
11 11 22 2211 22 11 22
22 22 22 33
C A C A G
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Ancestral Reconstruction Step I:Keep Track of Shortest Subtrees
11 11 22 2211 22 11 22
22 22 22 33
33 33 44 55
C A C A G
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Ancestral Reconstruction Step I:Keep Track of Shortest Subtrees
11 11 22 2211 22 11 22
22 22 22 33
33 33 44 55
C A C A G
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Ancestral Reconstruction Step II: Backtracking
A A
C A C A G
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Ancestral Reconstruction Step II: Backtracking
AA
AA
A A
C A C A G
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Ancestral Reconstruction Step II: Backtracking
AA
AA
A A
C A C A G
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Ancestral Reconstruction Step II: Backtracking
AAAA
AA
A A
C A C A G
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Ancestral Reconstruction Step II: Backtracking
AAAA
AA
A A
C A C A G
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Ancestral Reconstruction Step III: Placement of Changes
AAAA
AA
A A
C A C A G
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Ancestral Reconstruction Step II: Backtracking
AAAA
AA
A A CC
C A C A G
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Ancestral Reconstruction Step II: Backtracking
AA CCAA
AA CC
A A CC
C A C A G
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Ancestral Reconstruction Step II: Backtracking
AA CCAA
AA CC
A A CC
C A C A G
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Ancestral Reconstruction Step II: Backtracking
AA CCAA CC GG
AA CC
A A CC
C A C A G
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Ancestral Reconstruction Step II: Backtracking
AA CCAA CC GG
AA CC
A A CC
C A C A G
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Ancestral Reconstruction Step III: Placement of Changes
AA CCAA CC GG
AA CC
A A CC
C A C A G
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Ancestral Reconstruction Step III: Placement of Changes
AA CCAA CC GG
AA CC
A A CC
C A C A G
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Ancestral Reconstruction Step III: Placement of Changes
AA CCAA CC GG
AA CC
A A CC
C A C A G
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Ancestral Reconstruction: State Sets
AA CCAA CC GG
AA CC
A A CC
C A C A G
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Ancestral reconstruction: experimental analysis of extinct molecules
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Ancestral reconstruction: thermostability of ancestral proteins
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Ancestral reconstruction: thermostability of ancestral proteins
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Phylogeny and ancestral reconstruction for manuscripts
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Problems With Parsimony
Anders Gorm PedersenAnders Gorm Pedersen
Molecular Evolution GroupMolecular Evolution Group
Center for Biological Sequence AnalysisCenter for Biological Sequence Analysis
Technical University of DenmarkTechnical University of Denmark
[email protected]@cbs.dtu.dk
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Phylogenetically Informative Sites
1 3
42
1 2
43
1 2
34
1: A C G G G G G A A2: A C G G G G C A A3: A C G C C G T A A4: A C G C T C A A A
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Phylogenetically Informative Sites
G C
CG
G G
CC
G G
CC
1: A C G G G G G A A2: A C G G G G C A A3: A C G C C G T A A4: A C G C T C A A A
G C
C C
C C
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Not Informative
G C
TG
G G
TC
G G
CT
1: A C G G G G G A A2: A C G G G G C A A3: A C G C C G T A A4: A C G C T C A A A
G G
G G
G G
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Not Informative
G G
CG
G G
CG
G G
GC
1: A C G G G G G A A2: A C G G G G C A A3: A C G C C G T A A4: A C G C T C A A A
G G
G G
G G
CE
NT
ER
FO
R B
IOLO
GIC
AL
SE
QU
EN
CE
AN
ALY
SIS
Not Informative
G T
AC
G C
AT
G C
TA
1: A C G G G G G A A2: A C G G G G C A A3: A C G C C G T A A4: A C G C T C A A A
C C
T T
C C