EMBL Heidelberg Annotation und Klassifikation nuklearer Domänen Tobias Doerks.

29
EMBL Heidelberg Annotation und Klassifikation nuklearer Domänen Tobias Doerks

Transcript of EMBL Heidelberg Annotation und Klassifikation nuklearer Domänen Tobias Doerks.

Page 1: EMBL Heidelberg Annotation und Klassifikation nuklearer Domänen Tobias Doerks.

EMBL Heidelberg

Annotation und Klassifikation nuklearer Domänen

Tobias Doerks

Page 2: EMBL Heidelberg Annotation und Klassifikation nuklearer Domänen Tobias Doerks.

EMBL Heidelberg

Systematische Annotation bekannter nuklearer Domänen . und Implementation in die Domänendatenbank Smart

Identifikation und funktionelle Analyse . unbekannter (nuklearer) Domänen

Annotation und Klassifikation nuklearer Domänen (1)

Semi-automatische Analyse aller nuklearen Proteine

Page 3: EMBL Heidelberg Annotation und Klassifikation nuklearer Domänen Tobias Doerks.

EMBL Heidelberg

Eine Domäne ist eine evolutiv konservierte

strukturelle und funktionelle Einheit

PMS1_HUMAN

UBF1_HUMAN

WHSC1

Annotation und Klassifikation nuklearer Domänen (2)

Definition – Domäne:

eine sich unabhängig faltende Region eines Proteins

ein abgrenzbar homologer Bereich in Proteinen mit

unterschiedlicher modularer Architektur

Page 4: EMBL Heidelberg Annotation und Klassifikation nuklearer Domänen Tobias Doerks.

EMBL Heidelberg

Annotation und Klassifikation nuklearer Domänen (3)

Definition – nuklear:

80% nuklear in SwissProt

Literatur

Page 5: EMBL Heidelberg Annotation und Klassifikation nuklearer Domänen Tobias Doerks.

EMBL Heidelberg

Systematische Annotation bekannter nuklearer Domänen und Implementation in die

Domänendatenbank Smart (1)

Erstellung von Alignments

Generierung von HiddenMarkovModels

Page 6: EMBL Heidelberg Annotation und Klassifikation nuklearer Domänen Tobias Doerks.

Systematische Annotation und

Implementation (2)

118 (164) nukleare Domänen in mehr als 50000* Proteinen

(J. Schultz, R. R. Copley, T. Doerks,

C. P. Ponting, P. Bork Nucleic Acids Res 2000

Jan 1;28(1):231-234)

(I.Letunic, L. Goodstadt, N.J. Dickens, T.Doerks,

J. Schultz, R.Mott, F. Ciccarelli, R:R: Copley

C.P. Ponting, P. Bork Nucleic Acids Res 2002

Jan 1; 30(1):1-3

* Aktualisiterter Stand Januar 2003* Aktualisiterter Stand Januar 2003

Page 7: EMBL Heidelberg Annotation und Klassifikation nuklearer Domänen Tobias Doerks.

EMBL Heidelberg

- Gesamthäufigkeit

- Evolution

- Verteilung in unter- schiedlichen Spezies

Systematische Annotation und

Implementation (3)

Page 8: EMBL Heidelberg Annotation und Klassifikation nuklearer Domänen Tobias Doerks.

EMBL Heidelberg

- 3D-Struktur

- Literatur

Systematische Annotation und

Implementation (4)

- Krankheitsrelevanz

Page 9: EMBL Heidelberg Annotation und Klassifikation nuklearer Domänen Tobias Doerks.

EMBL Heidelberg

L27, eine neue Hetero-Dimer-bildende Domäne in . den Rezeptor-Targeting-Proteinen Lin-2 and Lin-7

Identifikation und funktionelle Analyse unbekannter (nuklearer) Domänen (1)

Page 10: EMBL Heidelberg Annotation und Klassifikation nuklearer Domänen Tobias Doerks.

EMBL Heidelberg

L27, eine neue

Hetero-Dimer-bildende Domäne in .

den Rezeptor-Targeting-Proteinen

Lin-2 and Lin-7

(Doerks T, Bork P, Kamberov E, Makarova O, Muecke S, Margolis B Trends Biochem Sci 2000 Jul;25(7):317-318)

-Heterotrimerkomplex aus Guanylatkinase Lin-2, Lin-7 und Lin-10

-Transport des Wachstumsfaktor Let-23 zur basolateralen MembranLet-23 zur basolateralen Membran von Epithelzellenvon Epithelzellen

Lin2-like proteinsLin2-like proteins

Lin7-like proteinsLin7-like proteins

other proteinsother proteins

Page 11: EMBL Heidelberg Annotation und Klassifikation nuklearer Domänen Tobias Doerks.

EMBL Heidelberg

L27, eine neue Hetero-Dimer-bildende Domäne in . den Rezeptor-Targeting-Proteinen Lin-2 and Lin-7

Identifikation und funktionelle Analyse unbekannter (nuklearer) Domänen (2)

GRAM, eine neue Domäne in Glucosyltransferasen, ..Myotubularinen und anderen Membran-assoziierten Proteinen

Page 12: EMBL Heidelberg Annotation und Klassifikation nuklearer Domänen Tobias Doerks.

(Doerks T, Strauss M, Brendel M, Bork P Trends Biochem Sci 2000 Oct;25(10):483-5)

GRAM, eine neue Domäne

in Glucosyltransferasen,

Myotubularinen und anderen

Membran-assoziierten

Proteinen

EMBL Heidelberg

Page 13: EMBL Heidelberg Annotation und Klassifikation nuklearer Domänen Tobias Doerks.

EMBL Heidelberg

L27, eine neue Hetero-Dimer-bildende Domäne in . den Rezeptor-Targeting-Proteinen Lin-2 and Lin-7

Identifikation und funktionelle Analyse unbekannter (nuklearer) Domänen (3)

GRAM, eine neue Domäne in Glucosyltransferasen, ..Myotubularinen und anderen Membran-assoziierten Proteinen DDT, eine neue DNA-bindende Domäne in unterschiedlichen ..Transkriptionsfaktoren, Chromosom-assoziierten und ..anderen nuklearen Proteinen

Page 14: EMBL Heidelberg Annotation und Klassifikation nuklearer Domänen Tobias Doerks.

(Doerks T, Copley R, Bork P 2001

Trends Biochem Sci 26, 145-146)

DDT, eine neue

DNA-bindende Domäne in

unterschiedlichen

Transkriptionsfaktoren,

Chromosom-assoziierten

und anderen nuklearen

Proteinen

EMBL Heidelberg

Page 15: EMBL Heidelberg Annotation und Klassifikation nuklearer Domänen Tobias Doerks.

EMBL Heidelberg

L27, eine neue Hetero-Dimer-bildende Domäne in . den Rezeptor-Targeting-Proteinen Lin-2 and Lin-7

Identifikation und funktionelle Analyse unbekannter (nuklearer) Domänen (4)

GRAM, eine neue Domäne in Glucosyltransferasen, ..Myotubularinen und anderen Membran-assoziierten Proteinen DDT, eine neue DNA-bindende Domäne in unterschiedlichen ..Transkriptionsfaktoren, Chromosom-assoziierten und ..anderen nuklearen Proteinen

BSD, eine neue putativ DNA-bindende Domäne in . Transkriptionsfaktoren, Synapsen-assoziierten ..und anderen hypothetischen Proteinen

Page 16: EMBL Heidelberg Annotation und Klassifikation nuklearer Domänen Tobias Doerks.

EMBL Heidelberg

BTF2-like transcription factorsYeast, Arabidopsis, C. elegans, Drosophila and human

Arabidopsis, C. elegans, Drosophila and human

Proteins with homology to Synapse-associated proteins of Drosophila

Arabidopsis,

BTB-domain-containing proteins Arabidopsis,

Dos2-like proteins in Yeast, Arabidopsis, C. elegans and human and other hypothetical proteins Paramecium and Leishmania

BSD

BSD

BSD

BSD

BSD

BSD

BSD, eine neue putativ

DNA-bindende Domäne in

Transkriptionsfaktoren,

Synapsen-assoziierten

und anderen

hypothetischen Proteinen

(Doerks T, Huber S, Buchner E, Bork P

2002 Trends Biochem Sci 27, 168-170)

Page 17: EMBL Heidelberg Annotation und Klassifikation nuklearer Domänen Tobias Doerks.

Automatisches Homologie-basiertes Gruppieren aller

unbekannten Regionen nuklearer Proteine

Ergebnis ohne iterative

PSI-BLAST-Suchen :

aus ~15000 Sequenzen

~ 4000 cluster

~ 150 in unterschiedlichem

Domänen-Kontext

~ 8 neue Domänen

Ergebnis mit iterativen

PSI-BLAST-Suchen :

aus ~15000 Sequenzen

~10000 cluster

~ 400 in unterschiedlichem

Domänen-Kontext

~ 20 neue Domänen

Semi-automatische Analyse aller nuklearen Proteine (1)

Page 18: EMBL Heidelberg Annotation und Klassifikation nuklearer Domänen Tobias Doerks.

EMBL Heidelberg

Semi-automatische Analyse aller nuklearen Proteine (2)

Klassifizierung 28 neuer Domänen

15 neue Domänen in verschiedenen Proteinfamilien in . unterschiedlichen Spezies und molekularem Kontext

3 spezies-spezifische Domänen

7 neue Subfamilien

3 N- oder C- terminale Domänen-spezifische Extensionen

28 neue Domänen in mehr als 1800 Proteinen*

Page 19: EMBL Heidelberg Annotation und Klassifikation nuklearer Domänen Tobias Doerks.

EMBL Heidelberg

Semi-automatische Analyse aller nuklearen Proteine (3)

Funktionsvorhersagen für 20 von 28 Domänen (1400* Proteine)

4 Domänen mit enzymatischer Funktion 4 Protein/Protein-Interaktionsdomänen 8 RNA/DNA-Bindungsdomänen 4 Metallionen-Bindungsdomänen

5 Domänen mit möglicher Krankheitsrelevanz

10 Domänen sind nukleusspezifisch lokalisiert

18 Domänen sind im Nukleus oder Cytosol lokalisiert

(Doerks T*, Copley R R*, Schultz J, Ponting C P, Bork P Genome Res 2002 Jan;12(1):47-57) *die Autoren sind gleichberechtigt beteiligt an der Publikation

Page 20: EMBL Heidelberg Annotation und Klassifikation nuklearer Domänen Tobias Doerks.

EMBL Heidelberg

Weitere Projekte und Kollaborationen

Analyse von Steroid-Hormonrezeptoren als Teil des

Humangenomprojektes (International Human Genome Sequence Consortium 2001 Nature 15, 860-921)

Kollaboration mit E. Izauralde Gruppe (Genexpression EMBL)(Stutz F, Bachi A, Doerks T, Braun I C, Seraphin B, Wilm M, Bork P, Izauralde E 2000 RNA 6, 638-650)

(Suyama M, Doerks T, Braun I C, Izauralde E, Bork P 2000 EMBO Reports 1, 53-58)

Re-Annotation des Mycoplasma pneumoniae Genoms(Dandekar T, Huynen M, Regula J T, Ueberle B, Zimmermann C U, Andrade M A, Doerks T, Sanchez-Pulido L, Snel B, Suyama M, Yuan Y P, Herrmann R, Bork P 2000 Nucleic Acids Res 28, 3278-3288))

Analyse von Spir (Actin organizer)(Kerkhoff E, Simpson J C, Leberfinger C B, Otto I M, Doerks T, Bork P, Rapp U R, Raabe T, Pepperkok 2001 Curr Biol 11 (24), 1963-8)

Kollaboration mit M. Vingron, theorethische Bioinformatik DKFZ(Nicodeme P, Doerks T, Vingron M 2002 Bioinformatics 18, 161-171)

Page 21: EMBL Heidelberg Annotation und Klassifikation nuklearer Domänen Tobias Doerks.

EMBL Heidelberg

Zusammenfassung

Systematische Annotation von 108 nuklearen Domänen . und Implementation in die Domänendatenbank Smart

Identifikation und funktionelle Analyse von 4 ..unbekannten Domänen (2 signalling, 2 nuklear)

Semi-automatische Analyse aller nuklearen Proteine und . Identifikation von 28 neuen Domänen in 1800* Proteinen

Page 22: EMBL Heidelberg Annotation und Klassifikation nuklearer Domänen Tobias Doerks.

EMBL Heidelberg

Danksagung

Gutachter der schriftlichen Arbeit und die Prüfer

Mitglieder der Bioinformatik-Arbeitsgruppe von Peer Bork

Peer Bork

Anna Starzinski-Powitz

Page 23: EMBL Heidelberg Annotation und Klassifikation nuklearer Domänen Tobias Doerks.

EMBL Heidelberg

Page 24: EMBL Heidelberg Annotation und Klassifikation nuklearer Domänen Tobias Doerks.

EMBL Heidelberg

Page 25: EMBL Heidelberg Annotation und Klassifikation nuklearer Domänen Tobias Doerks.

EMBL Heidelberg

Page 26: EMBL Heidelberg Annotation und Klassifikation nuklearer Domänen Tobias Doerks.

EMBL Heidelberg

MAGUKMAGUK

Cask_b mm 405 ACask_b mm 405 AVVQQRARAKKEEVVLLEEEEIISCYPE[1]NDSCYPE[1]NDAAKEKELLKRIKRILLTQ PHTQ PHFFMAMALLLLQQTTHHDDVVVVAHEVYSDEALR O70589 AHEVYSDEALR O70589

P55T/PALS2_b mm 56 NP55T/PALS2_b mm 56 NLLEELVLVNNEEIILLEDEDIITPLIS[2]ENTPLIS[2]ENVVAEAELLVGIVGILLKE PHKE PHFFQSQSLLLLEEAAHHDDIVIVASKCYDSPPSS AAD45009ASKCYDSPPSS AAD45009

Camguk_b dm 405 ACamguk_b dm 405 AVVGGRCRCRRDDVVLLEQEQLLSSTSG[7]YASSTSG[7]YAKKEEEELLMRLMRLLLAA PHAA PHMMQAQALLLLHSHSHHDDVVVVARDVYGEEALR Q24210ARDVYGEEALR Q24210

Dlg3_b hs 68 ADlg3_b hs 68 AVVAALALAEEDDVVMMEEEELLQAASV[1]SDEREQAASV[1]SDERELLLQLLQLLLST PHST PHLLRARAVLVLMMVVHHDDTVTVAQKNFDPVLPP Q13368AQKNFDPVLPP Q13368

Dlg2_b hs 91 NDlg2_b hs 91 NLLEELVLVQQEEIILLRDRDLLAQLAE[2]STAQLAE[2]STAAAEAELLAHIAHILLQE PHQE PHFFQSQSLLLLEETTHHDDSSVVASKTYETPPPS Q14168ASKTYETPPPS Q14168

LIN2_b ce 421 TSTLIN2_b ce 421 TSTLRLRKKEETTLLNQNQIIDGLLG[2]PEDGLLG[2]PEAALELELLRQLRQLLLNS PHNS PHLLASASCVCVQQALALDDVVVVVCEIRDPKNEA P54936VCEIRDPKNEA P54936

PALS1_b hs 186 VQDPALS1_b hs 186 VQDLVLVQQEEVQTVVQTVLLKPVHQ KEGQEKPVHQ KEGQELLTALTALLLNA PHNA PHIIQAQALLLLLLAAHHDDKVKVAEQEMQLEPIT AF199008AEQEMQLEPIT AF199008

HSZZ27178 hs 15 AHSZZ27178 hs 15 AAAAALALADDDDLLAAEEEELLQNKPL[1]SEQNKPL[1]SEIIRERELLLKLLKLLLSK PNSK PNVVKAKALLLLSSVVHHDDTTXAQKNYDPVLPP AA322046XAQKNYDPVLPP AA322046

Cask_a mm 346 ACask_a mm 346 AVVSQSQVVLLDDSSLLEEEEIIHALTD[3]KDHALTD[3]KDLLDFDFLLHSVHSVFFQD QHQD QHLLHTHTLLLLDDLYLYDDKIKINTKSSPQIRNP O70589NTKSSPQIRNP O70589

LIN-7LIN-7

LIN-7 ce 120 DLIN-7 ce 120 DVVQQRIRILLEELLMMEHEHVVQKTGE[3]AKQKTGE[3]AKLLASASLLQQVQQVLLQS EFQS EFFFGAGAVRVREEVYVYEETVTVYESIDADTTPE CAA22459 YESIDADTTPE CAA22459

LIN-7-BA rn 15 DLIN-7-BA rn 15 DVVAARARAIIEELLLLEKEKLLQESGE[3]HKQESGE[3]HKLLQSQSLLKKVKKVLLQS EFCTAQS EFCTAIRIREEVYVYQQYMYMHETITVNGCPE Q9Z251HETITVNGCPE Q9Z251

hypLIN7 sm 1 hypLIN7 sm 1 .............RCPE[3]SK .............RCPE[3]SKLLAAAALLQRIQRILLQS DFCDMQS DFCDMIRIREEVYVYEEHIHIYTTVDINGSEE O17458YTTVDINGSEE O17458

  

  

HPTHPT

rdea dd 26 Erdea dd 26 EKKEEFTFTFFEELLLLDSDSYYISSVE EHISSVE EHLLPEPELLLNSLNSFFEA [1]DLEA [1]DLKKGAGAVLVLHSHSHHDDIKIKGSSSYIGCEAV O77083GSSSYIGCEAV O77083

EVGS_ECOLI ec 1098 DEVGS_ECOLI ec 1098 DLLQQLMLMQQEEIILLMTMTFFQHETH KDQHETH KDLLPAPAAAFQAFQALLEA [1]DNEA [1]DNRRTFTFHHQCQCIIHHRRIHIHGAANILNLQKL P30855GAANILNLQKL P30855

ATHP3 at 38 NPDATHP3 at 38 NPDFVFVSQVSQVVVTLTLFFFQDSD RIFQDSD RILLNDNDLLSLSSLSLLDQ [3]DFDQ [3]DFKKKVDPHKVDPHVVHHQQLKLKGSSSSIGAQRV Q9ZNV9GSSSSIGAQRV Q9ZNV9

Consensus (80%) .hthh.-.hpph.t..t....ph..L.t.hpp......ht.hhthaphhttt...s....Consensus (80%) .hthh.-.hpph.t..t....ph..L.t.hpp......ht.hhthaphhttt...s....

Sec.struc.pred.(2lin) ..hHHHHHHHHHH.......HHHHHHHHHHh.....HHHHHHHHHHHHHhhhh.......Sec.struc.pred.(2lin) ..hHHHHHHHHHH.......HHHHHHHHHHh.....HHHHHHHHHHHHHhhhh.......

Sec.struc.pred.(7lin) .HHHHHHHHHHHHH......HHHHHHHHHHHH....HHHHHHHHHHHh............Sec.struc.pred.(7lin) .HHHHHHHHHHHHH......HHHHHHHHHHHH....HHHHHHHHHHHh............

Sec.struc.(1a0b) ..HHHHHHHHHHHHHHH...HHHHHHHHHHHH.....HHHHHHHHHHHHHHHHHH.....Sec.struc.(1a0b) ..HHHHHHHHHHHHHHH...HHHHHHHHHHHH.....HHHHHHHHHHHHHHHHHH.....

  

  

  

L27

Page 27: EMBL Heidelberg Annotation und Klassifikation nuklearer Domänen Tobias Doerks.

EMBL Heidelberg

FIP1 at 138 KVFIP1 at 138 KVFFKQTKQTFFD----D----CCLPDLPDEEKKLLLLKT------KT------YYAACCYYLLSTS--------------AGPSTS--------------AGPVVLLGGVVMMYYLLSSTHTHKLAKLAFFSSSSDNPLSYKE--GEQTLWSYYKDNPLSYKE--GEQTLWSYYKVVVVLLPPAANQNQLLKAKAVVNPST Q9SE96NPST Q9SE96

T31B5_20 at 143 SLT31B5_20 at 143 SLFFRQIRQIFFG----TEPNG----TEPNEETTLKLKKT------KT------FFAACCYYLLSTT--------------TGPSTT--------------TGPVVAAGGTTVVYYLLSSNANARVARVAFFCCSSDDRRPLYFTAP-SGQESWSYYRPLYFTAP-SGQESWSYYRVVVVVVPPLLANANVVATATVVNPVV CAB86627NPVV CAB86627

ARP hv 229 KLARP hv 229 KLYYKQTKQTFFG----SGPDG----SGPDEEHHVKVKKT------KT------FFAACCYYLLSTA--------------TGPSTA--------------TGPVVAAGGTTLLYYLLTTNTNNTNVAVAFFCCSSDDRRPLSFAAP-SGQTAWSYYKPLSFAAP-SGQTAWSYYKVVMMIIPPLLAKAKLLAAAAVVEPVT Q9ZTW0EPVT Q9ZTW0

  

UGT51B1a pp 196 EKUGT51B1a pp 196 EKLLKTTKTTFFD----D----LLSDDSDDDDEEFVFVND------ND------YYPPCCWWLLLH---------------ELH---------------EVVFFLLQQGGHHIIYYIITTSRSRYLLYLLYYFFAFAFLLPKRDS--------------------------- Q9Y751aPKRDS--------------------------- Q9Y751a

UGT51C1 ca 296 DKUGT51C1 ca 296 DKLLQRVQRVFFD----D----LLSDESDEDDTTFCFCGN------GN------YYSSAAWWLLIK---------------DIK---------------DVVLLLLQQGGHHVVYYLLTTKDKDALLALLYYFFAFAFLLPKRFS--------------------------- Q9Y752aPKRFS--------------------------- Q9Y752a

L9470.23a sc 187 AKL9470.23a sc 187 AKLLRQRRQRFFC----C----LLDEQDEQEEPPFLFLND------ND------FFPPAAWWLLLK---------------DLK---------------DVVLLVVQQGGHHIIFFIITTTKTKHFLHFLFFFFAYAYLLPKNPR--------------------------- Q06321aPKNPR--------------------------- Q06321a

UGT52 dd 207 IKUGT52 dd 207 IKIIKNKKNKLLG----G----LLPADPADEEVVLILITW------TW------FFNNCCTNFKG--------------AQLTNFKG--------------AQLKKYYGGFFLLYYIISSNNNNNNICICFFRRSSKKFFGFQKR----- ------TGFQKR----- ------TIIVVIIPPLLSQSQVVIEIEIIKKYS Q9XYD4KKYS Q9XYD4

  

YHO0_YEAST sc 548 AEYHO0_YEAST sc 548 AEFFHAIHAIFFKDS-GKDS-GVVSPNSPNEERRLILILD------LD------HHSSCCAALLSR---------------DSR---------------DIILLLLQQGGRRMMYYIISSDQDQHIHIGGFFYYSSNNIILGWVS------------TLGWVS------------TVVFFIIPPFFKTKTIIVQVQIIEKRA P38800EKRA P38800

D9798.13 sc 647 SED9798.13 sc 647 SEFFHTLHTLFFKDC-DKDC-DIINPNNPNEEKKLILIVD------VD------HHSSCCAALLSR---------------DSR---------------DIILLLLQQGGRRMMYYIISSDADAHIHIGGFFFFSSNNIILGWVS------------TLGWVS------------TVVFFIIPPFFKEKEIIVQVQIIEKKT Q06681EKKT Q06681

KIAA0767 hs 440 GNKIAA0767 hs 440 GNFFHEIHEIFFN----N----LLTENTENEERPRPLLAVCENG--AVCENG--WWRRCCCCLLINRDRKMPT--------DINRDRKMPT--------DYYIIRRNNGGVVLLYYVVTTENENYLCYLCFFEESSSSKKSGSSKR-----------NSGSSKR-----------NKKVVIIKKLLVDVDIITDTDIIQKYK Q9Y4B9QKYK Q9Y4B9

  

VRP hs 42 EFVRP hs 42 EFFFRAFRAFFFR----R----LLPRKPRKEEKKLHLHAV------AV------VVDDCCSSLLWTPFS------------RWTPFS------------RCCHTAHTAGGRRMMFFAASSDSDSYICYICFFAASSRREDGCC-------------KEDGCC-------------KIIIILLPPLLREREVVVSVSIIEKME O95759EKME O95759

KIAA0676a hs 154 LKKIAA0676a hs 154 LKMMRKQRKQFFG----G----MMPEGPEGEEKKLVLVNY------NY------YYSSCCSSYYWKG--------------RWKG--------------RVVPPRRQQGGWWLLYYLLTTVNVNHLCHLCFFYYSSFFLLLGKEV------------SLGKEV------------SLLVVVVQQWWVDVDIITRTRLLEKNA O75163 EKNA O75163

KIAA0676b hs 300 ECKIAA0676b hs 300 ECYYRATRATFFR----R----LLPRDPRDEERRLLDGH------TSDGH------TSCCTTLLWTPFN------------KWTPFN------------KLLHHIIPPGGQQMMFFIISSNNNNYICYICFFAASSKEEDAC-------------HKEEDAC-------------HLLIIIIPPLLREREVVTITIVVEKAD O75163 EKAD O75163

Y45F10A.6a ce 166 EKY45F10A.6a ce 166 EKFFHKSHKSFFS----S----IIPPDPPDEEKKLVLVNY------NY------YYKKCCCCLLWKG--------------KWKG--------------KVVPPAAQQGGDDLLFFLLSSVNVNFLCFLCFFHHAFAFMMMGNET------------KMGNET------------KIIKKLLKKWWTDTDIIVRVRLLERVS O62462 ERVS O62462

Y45F10A.6b ce 321 DAY45F10A.6b ce 321 DAFFRCQRCQFFN----N----LLPLTPLTEEKKLLDGD------TQDGD------TQCCRRLLFTPYD------------RFTPYD------------RRRHHVVPPGGKKLLFFVVSSANANFVCFVCFFAASSRTERLV-------------SRTERLV-------------SIIVVVVPPLLIEIEVVTSTSIIEECS O62462 EECS O62462

CG7324a dm 136 SKCG7324a dm 136 SKFFRQIRQIFFK----K----MMPEEPEEEERRLVLVIS------IS------YYSSAATTYYVKN--------------KVKN--------------KIIPPRRQQGGQQLLYYIISSLNLNHVCHVCFFYYSSYYMMLGQEI------------KLGQEI------------KRRIIIIRRFFAEAELLEDEDIISRNA Q9VP46 SRNA Q9VP46

CG7324b dm 282 EECG7324b dm 282 EEFFRIYRIYFFR----R----LLPQSPQSEEIIIIDGK------DGK------IIKKAANNIIWTPYS------------KWTPYS------------KRRFNSFNSGGFFIIYYLLSSPNPNFFCFFCFFRRSSDDVVKDLV-------------SKDLV-------------SVVVVIIPPMMKTKTIIKSKSVVEKKD Q9VP46 EKKD Q9VP46

MIC1_YEAST sc 29 EKMIC1_YEAST sc 29 EKFFRLKRLKYYK----K----LLPANPANEENNILILEDTNAEVSEDTNAEVSFFATSATSIIKDGKGHSDRVNNKGRKTAKDGKGHSDRVNNKGRKTAYYVVYYSSGGRRLLFFLLTTPHPHFLVFLVFFRRDADAFFDHSSC------------VDHSSC------------VLLIILLNNIISTSTIIKRKRVVERSP P53258ERSP P53258

C1259.11C sp 20 LDPASFC1259.11C sp 20 LDPASFFFR----R----IINKQNKQEEEEIIIIAS------TVAS------TVCCEEIIGWE--------------YSKSFGWE--------------YSKSFGGNNAAYYIICTSCTSFLCFLCFFHHSSDDFKT--------------RDDFKT--------------RFFTTFFPPLLAAAAVVRKRKLLEREN O94711 EREN O94711

** **** **

MTM1_HUMAN hs 29 RDMTM1_HUMAN hs 29 RDLLTEATEAVVP----P----RRLPGLPGEETTLILITD--KEVITD--KEVIYYIICCPPFFNG-----------------PNG-----------------PIIKKGGRRVVYYIITTNYNYRLYLRRLYLRSS--LLETDSSL-----------IETDSSL-----------ILLDDVVPPLLGVGVIISRSRIIEKMG Q13496EKMG Q13496

MTMR1 hs 90 AQMTMR1 hs 90 AQMM-EE-EEAAP----P----LLFPGFPGEESSIKIKAI-VKDVMAI-VKDVMYYIICCPPFFMG-----------------AMG-----------------AVVSSGGTTLLTTVVTTDFDFKLYKLYFFKKN-N-VVERDPHF-----------IERDPHF-----------ILLDDVVPPLLGVGVIISRSRVVEKIG AJ224979EKIG AJ224979

  

SBF_DM dm 922 PKSBF_DM dm 922 PKIIQTPQTPCC----------LLLPGLPGEEDDLVLVTD-----HTD-----HLLRRCCFFLLMPDGREDE------TQCLMPDGREDE------TQCLIIPPAAEEGGAALLFFLLTTNYNYRVIRVIFFKKGSPCDPLFCEQ-------VIVGSPCDPLFCEQ-------VIVRRTTFFPPIIASASLLLKEKKIS AE003693LKEKKIS AE003693

SBF1 hs 656 PKSBF1 hs 656 PKLLLRPLRPRRL----L----LLPGEPGEEECCVLVLDG------DG------LLRRVVYYLLLPDGREEGAGGSAGGPALLPDGREEGAGGSAGGPALLLPPAAEEGGAAVVFFLLTTTYTYRVIRVIFFTGMPTDPLVGEQ-------VVVTGMPTDPLVGEQ-------VVVRRSSFFPPVVAAAALLTKEKRIS AAC39675TKEKRIS AAC39675

SBF_CE ce 788 GNSBF_CE ce 788 GNFF-DP-DPVV----------LLAHGAHGEEFFLILISD-----PSD-----PIIDDCCYYLLLTSIEESE-MSLNRLENLLTSIEESE-MSLNRLENLLLPPAADDGGSSLLFFLLTTNYNYRVIRVIFFKKGKSVDINATNG-------TIVQTGKSVDINATNG-------TIVQTIIPPLLYSYSMMESESFFKKLT AAC67405KKLT AAC67405

Consensus 80% ..hpp.a.....h...-phh.p......a.s.h.p...............ph.h.G.haho..hhsFhu.h..................h.h.h.ph..hp...Consensus 80% ..hpp.a.....h...-phh.p......a.s.h.p...............ph.h.G.haho..hhsFhu.h..................h.h.h.ph..hp...

Sec.struct.pred. ...ee.............ee........eEEEEe....................eEEEEEE.eEEEEEe.............hhhhhhhhhhhhhhhhhhh... Sec.struct.pred. ...ee.............ee........eEEEEe....................eEEEEEE.eEEEEEe.............hhhhhhhhhhhhhhhhhhh...

GRAM

Page 28: EMBL Heidelberg Annotation und Klassifikation nuklearer Domänen Tobias Doerks.

EMBL Heidelberg

  

BPTF hs 102 NEHBPTF hs 102 NEHIIMNMNVIVIAAIYIYEEVLVLRNRNFFGTGTVVLLR-R-LLSPSPFFR------R------FFEDEDFFCAACAALLVSQ-EQCTLVSQ-EQCTLMMAAEEMHVVMHVVLLLLKKAVAVLREEDT Q9UIG2LREEDT Q9UIG2

CG17135 dm 189 NTHCG17135 dm 189 NTHVVLRLRALALSSIYIYEEVLVLRRRRFFRHRHMVMVR-R-LLSPSPFFR------R------FFEDEDLLCAACAALLACE-EQSALACE-EQSALLLTTEEVHIMVHIMLLLLKKAIAILREEDA Q9W0T0LREEDA Q9W0T0

F26H11 ce 253 TASF26H11 ce 253 TASIIMDMDAVAVEEIYIYEEILILRSRSYYHRHRTTLLR-R-IITPTPFFT------T------FFEDEDFFCAACAALLISH-NNSCIISH-NNSCIMMAAEEVHMAVHMALLLLRNRNCCLKSDDE O45409LKSDDE O45409

BAZ1A hs 573 PEIBAZ1A hs 573 PEIFFGDGDALALMMVLVLEEFFLLNANAFFGEGELFLFD-D-LLQDEFPDG-VTQDEFPDG-VTLLEEVVLLEEAEEALLVGN-DSEGPVGN-DSEGPLLCCEELLFFFLLFFFLLTTAIAIFQAIAE Q9UIG1FQAIAE Q9UIG1

BAZ1B hs 605 NTLBAZ1B hs 605 NTLFFGDGDVAVAMMVVVVEEFFLLSCSCYYSGSGLLLL----LLPDPDAAQYP--ITQYP--ITAAVSVSLLMEAMEALLSADKGGFLYSADKGGFLYLLNRNRVLVIVLVILLLLQTQTLLLQDEIA Q9UIG0LQDEIA Q9UIG0

ACF1 dm 347 EHLACF1 dm 347 EHLLLGDGDAFAFMMMRMREEFFMMHTHTYYTGTGLLLLSGSGIIEVEVFFRQN--LSRQN--LSFFYYEEMMTRATRALLTAR-EIAGPTAR-EIAGPLLSSDDILLVILLVLLLLGTGTVVFDLQKE Q9Y0W1FDLQKE Q9Y0W1

ZK783 ce 525 SQGZK783 ce 525 SQGFFADADALALMMVHVHEEFFVVQNQNFFGHGHVVLLG-G-IIDLEIA---PKDLEIA---PKLLEESSLLCAGCAGLLDGDANHAEQTLQDGDANHAEQTLQLLTTRRQQLLLLRRLALALEFPGM Q23590LEFPGM Q23590

H20J04 ce 473 NAEH20J04 ce 473 NAEFFEDEDYLYLFFIFIFQQFFFFNSNSFFKQKQLLLLP-P-LLKEKEIIRGSDEVQRGSDEVQFFSSDDIIIIAIIAIIKCNDPQNSSKCNDPQNSSFFAADDLLRVLLRVLLLLSSIRIRTDIADE AAF39888TDIADE AAF39888

F3M18 at 658 DETF3M18 at 658 DETVVGNGNLLLLMMVWVWRRFFLLISISFFSDSDVVLLD-D-LLWPWPFFT------T------LLDEDEFFIQAIQAFFHDY-DSR-LHDY-DSR-LLLGGEEIHVIHVTTLLLLRSRSIIIRDVED Q9SGP0IRDVED Q9SGP0

MLN1 at 515 DENMLN1 at 515 DENVVANANLLLLMMVWVWRRFFLLITITFFADADVVLLG-G-LLWPWPFFT------T------LLDEDEFFAQAAQAFFHDY-DPR-LHDY-DPR-LMMGGEEIHIVIHIVLLLLKTKTIIIKDIEG BAB10985IKDIEG BAB10985

MOI20 at 193 EEAMOI20 at 193 EEAVVAHAHLLLLSSVYVYGGFFLLRSRSFFSFQSFQLLY-Y-IICPCPFFE------E------LLNNDDFFVGAVGALLYFS-GPNSLYFS-GPNSLLLDADAVHVAVHVALLLLRRALALKGHLER BAA98208KGHLER BAA98208

MAH20 at 298 MDCMAH20 at 298 MDCVVGDGDLLLLMMVWVWDDFFCCTSTSFFGRQGRQLLH-H-LLWRWRFFS------S------LLEDEDFFENAENAVVCHKESNLVLCHKESNLVLIIMMEEVHAVHASSLLFFRRFLFLINERGD BAB10012INERGD BAB10012

Ypl216 sc 376 QFPTERYpl216 sc 376 QFPTERLLLLVVVYVYQQFFLLSFSFFFGRGRFIFIG-G-LLSHSHFFN------N------FFDDQQFFLTTLTTIIKCT-SPEALKCT-SPEALVVDDEEYVYVKKIINNFFLKTYNSKGS Q08964LKTYNSKGS Q08964

F1N21 at 217 TEEF1N21 at 217 TEEAAGNGNVCVCQQLFLFEEFFCCSASAFFGKGKAALLA-A-LLKEGHAET-IVKEGHAET-IVRREELLFFICGICGRRNTRRQQYCSNTRRQQYCSIITQTQMMIMMIQQLLLLDDLILISKDREM O49273SKDREM O49273

YGN3 sc 424 FDSYGN3 sc 424 FDSFFGKGKLLLLQQAYAYQQFFLLNTNTFFGSKGSKIIC-C-LLSHSHFFS------S------LLDDQQFFITSITSLLKCT-DPYELKGKCT-DPYELKGEEVVLVVVLVNNIIRTQTSKEQE P53125RTQTSKEQE P53125

hypAT1 at 187 EEAhypAT1 at 187 EEAVVVYVYLLLLSSVYVYGGFFLLRSRSFFSVQSVQLLY-Y-IICPCPFFG------G------LLDDDDFFVGAVGALLNFL-GPNSLNFL-GPNSLLLDADAVHVAVHVALLMMRRALALKGHLER BAB11682KGHLER BAB11682

hypAT2 at 258 PEDhypAT2 at 258 PEDAAGNGNVFVFQQFLFLEEFFCCSASAFFGKGKAALLD-D-LLRKGQAE--CVRKGQAE--CVIIRREEMMLSGLSGRRSKRRQQYSTSKRRQQYSTLLTQTQMIIMIIQQLLLLTTVIVILEDRGE BAB10159LEDRGE BAB10159

Consensus(80%) ...h.phh.lhpFhpsFuphL..lp.hp......hpph..ul.sp.p....h.plhhhLLphhhpp...Consensus(80%) ...h.phh.lhpFhpsFuphL..lp.hp......hpph..ul.sp.p....h.plhhhLLphhhpp...

sec.struc.pred ...hhHHHHHHHHHHHHHhh..............HHHHHHHH.......hHHHHHHHHHHHHHHh....sec.struc.pred ...hhHHHHHHHHHHHHHhh..............HHHHHHHH.......hHHHHHHHHHHHHHHh....

DDT

Page 29: EMBL Heidelberg Annotation und Klassifikation nuklearer Domänen Tobias Doerks.

EMBL Heidelberg

TFB1_a sc 165 LDDSLSTFB1_a sc 165 LDDSLSKKEEKLLTNKLLTNLLKLQQ---SKLQQ---SLLLLKGNKVKGNKVLLMKMKVFVFQE---TQE---TVIVINAGNAGLLPPSEPPSEFWFWSTSTRIRIPLPLLLRARAFFA P32776A P32776

TFB1_b sc 243 SENKVNTFB1_b sc 243 SENKVNVVNLSRNLSREEKKIIL------NL------NIFIFENYPIENYPIVVKKKKAYAYTD----NTD----NVVPPKNKNFFKKEEPEPEFWFWARARFFFFSSSSKKLFLFRRK P32776K P32776

BTF2_a hs 99 LLPKFKBTF2_a hs 99 LLPKFKRRKANKKANKEELEEKN----RLEEKN----RMLMLQEDPVQEDPVLLFQFQLYLYKD---LKD---LVVVVSQVSQVIISAEESAEEFWFWANANRLRLNVNATDS P32780NVNATDS P32780

BTF2_b hs 180 GCNGLRBTF2_b hs 180 GCNGLRYYNLTSNLTSDDIIIIE------SE------SIFIFRTYPARTYPAVVKMKMKYKYAE----NAE----NVVPPHNHNMMTTEEKEKEFWFWTRTRFFFFQSQSHHYFYFHHR P32780R P32780

TFB1dm_a dm 109 LLPNFKTFB1dm_a dm 109 LLPNFKRRKVDKKVDKDDLEDKN----RLEDKN----RILILVENPNVENPNLLLQLQLYLYKD---LKD---LVIVITKVTKVLLTSDETSDEFWFWATATHHAAKDKDHHALALKKK Q9V713 K Q9V713

TFB1dm_b dm 182 GCNGLKTFB1dm_b dm 182 GCNGLKYYNLTSNLTSDDVVIIH------CH------CIFIFKTYPAKTYPAVVKRKRKHKHFE----NFE----NVVPPAKAKMMSSEEAEAEFWFWTKTKFFFFQSQSHHYFYFHHR Q9V713R Q9V713

R02D3.3_a ce 116 NELAKSR02D3.3_a ce 116 NELAKSVVEESQSKQSQSKQVVELQAKQKIELQAKQKILLQEDRNLEKLQEDRNLEKLYYQNL----QNL----VAVATKLTKLIITPDDTPDDFWFWSDSDYYYYQKEGVSE O44499 QKEGVSE O44499

R02D3.3_b ce 231 CKEILKR02D3.3_b ce 231 CKEILKFFTIQCTIQCEEYYLLTR-----KTR-----KIISRSENYSRSENYIIQKQKKKNLE----NLE----LVLVPPHEHEMMSSEEENENFWFWKKKKFFFFQSQSHHYFYFHHR O44499 R O44499

F2A19.20_a at 82 LTPAEQF2A19.20_a at 82 LTPAEQLLSMAEFESMAEFELLRF-----KRF-----KLLLLRENSERENSELLQKQKLHLHKQ---FKQ---FVVESKVESKVLLTTEEDEDEFWFWSTSTRKRKKLKLLLGKDS Q9M322 GKDS Q9M322

F2A19.20_b at 161 RTNRVTF2A19.20_b at 161 RTNRVTFFNLTSNLTSEEIIIIF------QF------QIFIFAEKPAAEKPAVVRQRQAFAFIN----IN----YVYVPPKKKKMMTTEEKDKDFWFWTKTKYFYFRAEYLRAEYLYYS Q9M322S Q9M322

SPAC16E8_a sp 60 RVNSTNSPAC16E8_a sp 60 RVNSTNLLEEKDIKDIDDLQE------SLQE------SLLLLTNNPDTNNPDLLLQTLQTFFKE---AKE---AVMVMKGHKGHLLSNEQSNEQFWFWSTSTRLRLHLHLLLRARAHHA O13745 A O13745

SPAC16E8_b sp 134 VDNQMKSPAC16E8_b sp 134 VDNQMKVVSLTGQQSLTGQQIIH------DH------DMFMFEQHPLEQHPLLLRKRKVYVYDK----DK----HVHVPP-P-PLLAAEEGEGEFWFWSRSRFFFFLSLSKKLCLCKKK O13745 K O13745

B8B20.390_a nc 147 WFEDDMB8B20.390_a nc 147 WFEDDMLLKADVKADVEELQQ------SLQQ------SLMLMKKDKAKKDKALLAHAHIYIYND[6]DSND[6]DSLLSDASFNSQSDASFNSQFWFWATATRIRISLSLLLRARAYYA Q9P5N7 A Q9P5N7

Consensus (80%) ......hp.p...h........lhp....l..hh.p....hss..hp.ppFW.haa..h..h.Consensus (80%) ......hp.p...h........lhp....l..hh.p....hss..hp.ppFW.haa..h..h.

sec.struc.pred ........hhHHHHHHHHHHHHHHHh.hHHHHHHHH...........hHHHHHHHHHHh...sec.struc.pred ........hhHHHHHHHHHHHHHHHh.hHHHHHHHH...........hHHHHHHHHHHh...   

BSD