bioinfo-1 Nei

57
Pengantar Bioinformatika

Transcript of bioinfo-1 Nei

Page 1: bioinfo-1 Nei

Pengantar Bioinformatika

Page 2: bioinfo-1 Nei

Sejarah singkat

Tahun 1960-an molecular evolution

J Theoretical Biology 1965Molecules as documents of evolutionary biologyZukerkandl E, Pauling L

Atlas of Protein Sequences (1965)Margareth Dayhoff

Tahun 1970-an computational biology

Needleman-Wunsch global alignment

Tahun 1990-an bioinformatics

NCBI (NLM/NIH) (1988)

Human Genome Project (1990)

dst

Page 3: bioinfo-1 Nei

Bioinformatika / Biologi (Molekuler) Komputasi

Biologi molekuler

• Data• Problema• Hypothesis• Teori

• Interpretasi• Verifikasi• Biological “insight”

Computational Sciencematematika,statistik,ilkom, dll

Teknologi Informasi

• Metode• Algoritma

• Tools / software• Database• Konektivitas/Internet

• Analisis• Modeling• Simulasi• Visualisasi

+ +

Page 4: bioinfo-1 Nei

Bioinformatics ≠ Medical Informatics

• Bioinformatika penerapan ilmu komputasi & informatika untukmemahami mekanisme/cara kerja mahluk hidup pada tingkatmolekulerContoh:– mencari gen yang berperan dalam suatu penyakit– mencari protein penyebab patogenesis– mencari dan mendesain obat

• Medical Informatics penerapan teknologi informatika dalambidang kedokteranContoh:– penggunaan IT dalam manajemen data pasien / klinis– diagnosis penyakit (database penyakit, sistem pakar)– Medical imaging (NMR/MRI, dsb)

Page 5: bioinfo-1 Nei

Organisasi DNA

Page 6: bioinfo-1 Nei

Central Dogma of Molecular Biology

DNA (blueprint)

RNA (coding sequences)

Protein (fungsional machinery)

Page 7: bioinfo-1 Nei

Phenotype / Morphology (1)

Phenotype / Morphology

Gen / Protein Ekspresi Protein

building block regulasi / aransemen

• Variasi sekuen DNA• Imprinting/Epigenetic

Page 8: bioinfo-1 Nei

Phenotype / Morphology (2)

• Variasi sekuen DNA dan Epigenetics antara lain dapatmengakibatkan:– Perbedaan phenotype / morphology

• Manusia: tinggi / rendah, etc• Mouse: warna• Tanaman: berbuah banyak / manis

– Penyakit bawaan / genetik– Perbedaan respon imun terhadap patogen (host-pathogen interaction)– Perbedaan respon terhadap obat– Perbedaan susceptibility terhadap penyakit kompleks / degeneratif:

• Alzheimer• Kanker• Jantung• dsb

Page 9: bioinfo-1 Nei

Contoh Aktifitas Bioinformatika

• Pengumpulan informasi– Literatur– Anotasi gen:

sekuen, variasi DNA, lokasi, ekspresi, modifikasi, struktur, dll– Data lain: data klinis, dll

• Akusisi data– Sekuensing DNA– Ekspresi gen (realtime RT-PCR)

• Analisa– Mendapatkan informasi/pengetahuan (hipotesis) baru– Mendapatkan prediksi/trend dari data

• Interpretasi secara biologi

Page 10: bioinfo-1 Nei

Aktifitas Bioinformatika (2)

Page 11: bioinfo-1 Nei

Aplikasi Central Dogma dalam Akusisi Data

Sekuen DNA (sequencing)

Regulasi gen(microarray,realtime/quantitative RT-PCR)

+Sekuen RNA (EST, cDNA sequencing)

Sekuen protein (AA sequencing, MS)

+ Interaksi antar/inter molekulStruktur protein (kristalografi, NMR)

Fungsi protein (assay, transgenik)

Page 12: bioinfo-1 Nei

Knowledge Discovery

Public databases “wet” experiment

Data acquisition

Data management | data manipulation

Visualization | modeling |analysis

Result interpretation

New knowledge | prediction

publication “wet” experimentproduct

Major goal: To understand how life works

Page 13: bioinfo-1 Nei

Analisa Bioinformatika

• Analisa sekuen:– Mapping situs restriksi– Prediksi daerah exon-intron– Prediksi daerah antigen– Desain primer PCR & probe– Prediksi fungsi– Identifikasi gen

• Analisa struktur– Struktur sekunder (alpha-helix, beta-sheet)– Struktur tertier (3-Dimensi)

• Analisa interaksi– Interaksi antar gen– Interaksi antar protein/makromolekul

Page 14: bioinfo-1 Nei

Domain Permasalahan

Studi Bioinformatika

Genom & Proteom

Struktur MolekulRegulasi dan NetworkGen

Lainnya

• sequence alignment• pencarian sekuen• DNA sequencing• identifikasi gen/protein• pencarian domain/motif• gene finding• anotasi• analisa linkage• analisa forensik• analisa evolusi/phylogenetics• studi populasi

• prediksi:• struktur sekunder• struktur tertier (3D)• topologi protein• antigenic determinant• protein docking

• molecular dynamics

• Ontologi Gen• Mining literatur• Simulasi metabolicpathway

• Manajemen data • user interface

• korelasi pola ekspresi• mapping data ekspresike data sekuen, strukturdan biokimia

• Pencarian gene ygberkaitan dgn penyakit

Page 15: bioinfo-1 Nei

Pentingnya Bioinformatika dalam Biologi Molekuler

• Kuantitas data biologi molekuler• Kompleksitas data biologi molekuler• Kompleksitas analisa data• Ruang lingkup penelitian• Biologi sebagai ilmu kuantitatif• Infrastruktur terjangkau & labor-intensive• Efisiensi eksperimen• Value-added pada penelitian

Page 16: bioinfo-1 Nei

Kuantitas Data Molekuler Biologi (1)

• Pertambahan data secara eksponensial akibat perkembanganteknologi akusisi data / teknologi eksperimental pada biologimolekuler.

• Contoh:– perkembangan teknologi sekuensing DNA secara otomatis, sehingga

data pada Genbank rata-rata bertambah 2X setiap 18 bulan.– eksperimen micro-array dapat menghasilkan 500,000 data ekspresi

per sampel (untuk 100 sampel, akan ada 50,000,000 data yang harusdianalisa)

• Pertambahan jumlah pemakai pada tiap-tiap database per tahunnya.

Page 17: bioinfo-1 Nei

Kuantitas Data Biologi Molekuler (2)

Jumlah data (Februari 2008):• GenBank: 85,759,586,764 basa (82,853,685 sekuen record)• Whole Genome Sequence: 108,635,736,141 basa (27,439,206 sekuen record)

Page 18: bioinfo-1 Nei

Kompleksitas Data Biologi Molekuler

Kompleksitas data biologi molekuler munculkarena kompleksitas pada struktur molekul yang ada pada sistem biologi.

kompleksitas struktur gene pada eukaryotes

Page 19: bioinfo-1 Nei

Kompleksitas Data Biologi Molekuler (2)

DNA

hnRNA(heterogenous nuclear RNA)

Protein (precursor)

mRNA (coding sequence) non-coding RNA(regulatory, fungsional machinery)

transkripsi

splicing

translasi

Post-translational modification

Protein (mature)

Kompleksitas pada proses ekspresi gen eukaryotes:Central Dogma of Molecular Biology (extended)

Page 20: bioinfo-1 Nei

Kompleksitas Data Biologi Molekuler (3)

Kompleksitas pada struktur protein dan interaksinya denganprotein/molekul lain

Page 21: bioinfo-1 Nei

Kompleksitas Analisa Data

Kompleksitas pada pencarian data di database:– Database tidak akan berguna apabila tidak dilengkapi

dengan tools untuk mencari dan menganalisa data!– BLAST: Basic Local Alignment Searching Tools adalah

algoritma (dan tools) standar untuk mencari sekuenDNA maupun protein pada database yang memilikikemiripan dengan sekuen kueri, serta menganalisaapakah kemiripan tersebut signifikan secara biologimaupun secara statistik.

Page 22: bioinfo-1 Nei

Kompleksitas Analisa Data (2)

Analogi BLAST: mencari record pasien yang memiliki nama Rahman:

– Rahman– Rahmawati– Rachman– Rakhman

Page 23: bioinfo-1 Nei

Kompleksitas Analisa Data (3)

Data yang didapat dari akusisi data tidaksemuanya dapat dipergunakan secara langsung:– Data harus “dibersihkan” untuk menghilangkan noise– Data harus dinormalisasi agar dapat dianalisa secara

bersamaan– Data harus digabungkan agar dapat dipergunakan

untuk analisa, contoh adalah sekuensing de-novo genome suatu organisme dengan metode shot-gun.

Page 24: bioinfo-1 Nei

Kompleksitas Analisa Data (4)

• Metode whole-genome shotgun sequencing memecah secara acak suatugenome menjadi fragmen DNA yang dapat disekuen satu-persatu untukkemudian digabungkan kembali menjadi satu untaian DNA yang utuh

• Proses penggabungan kembali (contig assembly) dapat dianalogikan sepertipermainan puzzle yang kompleks

• ~ 1 juta fragmen DNA• Reverse-complement

• Low complexity (A, T, C, G)

• Fragmen tidak komplit

• Kualitas fragmen tidak merata

• Duplikasi fragmen• Kontaminasi

• < 10,000 potongan• Puzzle memiliki gambar yang mirip pada

tiap sisinya• Gambar hanya menggunakan warna yang

terbatas• Tidak semua potongan tersedia (ada yg

hilang)• Banyak potongan puzzle yang gambarnya

memudar, terkena noda atau rusak(terpotong, dsb)

• Banyak potongan yang hampir sama• Ada potongan dari puzzle lain yang

tercampur

Page 25: bioinfo-1 Nei

Shotgun Sequencing1500000 bp

random fragmentation

cloningsequencingassembling

Page 26: bioinfo-1 Nei

Kompleksitas Analisa Data (5)

Kompleksitas pada analisa data yang membutuhkan algoritma yang lebih advanced karena sistem biologi merupakan suatu sistemyang sangat kompleks dan memiliki interaksiyang sangat kompleks pula.

Contoh analisa kompleks:– Penggunaan artificial intelligence & machine learning

untuk memprediksi daerah binding pada sekuen DNA

Page 27: bioinfo-1 Nei

Kompleksitas Analisa Data (6)

Page 28: bioinfo-1 Nei

Ruang Lingkup Penelitian

Aktifitas rekayasa genetika umumnyamelibatkan personil dari group/lab atau institusiyang berbeda, karena ruang lingkup kegiatannyasangat luas.– Fasilitas komunikasi (email, group-list)– Shared folders (workgroup/collaboration tools)

untuk berbagi data dan dokumen secara cepat– Ekpserimen dan analisa bersama, tergantung dari

kompetensi masing-masing personel/lab/institusi– Semakin berkembang karena perkembangan internet

Page 29: bioinfo-1 Nei

Biologi Sebagai Ilmu Kuantitatif

Biologi, terutama biologi molekuler, mulai berkembangmenjadi ilmu kuantitatif dengan memadukan statistikdan matematika terapan untuk keperluan analisa.

Contoh:mekanisme molekuler akibat kelainan dari suatu gene dapatdijelaskan secara kualitatif, namun seberapa besar efek darikelainan tersebut sehingga dapat menyebabkan penyakitgenetik harus dijelaskan secara kuantitatif.

Page 30: bioinfo-1 Nei

Infrastruktur Terjangkau & Labor-Intensive

• Infrastruktur paling minimal: komputer dan koneksi ke internet

• Processing power dari komputer saat ini cukup memadai untukanalisa lokal (analisa dengan menggunakan software yang berjalandi komputer user)

• Software untuk keperluan analisa bisa didapatkan secara gratis (opensource atau academic license)

• Analisa dapat dilakukan secara remote, misalnya melalui web service apabila tidak dapat dilakukan secara lokal (public maupunregistered user, gratis atau komersil)

• Labor-intensive karena membutuhkan keahlian dan ketekunan user saja

Page 31: bioinfo-1 Nei

Efisiensi Eksperimen

• Bioinformatika dapat mem-”by-pass” beberapaeksperimen lab tertentu.– Pada Human Genome Project, metode shotgun sequencing

memungkinkan peneliti untuk melakukan kloning dengan jumlahyang lebih sedikit.

• Bioinformatika memungkinkan aktifitas eksperimen in-silico

• Eksperimen in-silico dapat dipergunakan untuk:– Memprediksi outcome dari hasil suatu eksperimen– Menyeleksi target– Memperkecil kesalahan yang terjadi

Page 32: bioinfo-1 Nei

Memberikan Nilai Tambah Pada Penelitian

• Penelitian dapat dikembangkan lebih lanjut denganmelakukan analisa lanjutan dengan data yang sudahtersedia, atau dengan menggabungkan data lain darieksperimen lainnya atau dari data yang sudahdipublikasikan.

Contoh penggunaan data yang diakusisi sendiri dan data yang sudah dipublikasikan:– analisa phylogenetics– analisa komparatif suatu gene/protein

Page 33: bioinfo-1 Nei

Waktu Penggunaan Bioinformatika

Sebelum eksperimen• Hipotesis• Fisibilitas• Metodologi penelitian

• Troubleshooting• Verifikasi/identifikasi hasil

Saat eksperimen

• Analisa data• Interpretasi hasil

Sesudah eksperimen

Page 34: bioinfo-1 Nei

Forward Genetics

phenotype genotype( sample-based)

Mencari gen atau faktor penyebab/pemicu munculnya suatu phenotype, misalnya mencari gen atau mutasi penyebab suatu penyakit

“phenotype of interest”koleksi sampel

Mapping / sequencing DNASemi-quantitative (real-time) RT PCR / Microarray

Protein assay

Analisa datasequence: multiple alignment

ekspresi: statistikassay: modeling/ODE

Gen / faktor bersangkutan

Page 35: bioinfo-1 Nei

Reverse Genetics

genotype phenotype(sequence-based)

Melihat atau mengkonfirmasi hasil/efek/implikasi pada phenotype dari suatu gen/faktor,misalnya mencari efek/implikasi dari suatu mutasi pada sebuah gen

“sequence of interest”

Analisa sekuen(prediksi fungsi / simulasi molekuler)

Knock-off/on gene | Protein expression & assay

Analisa phenotype | Analisa hasil

Page 36: bioinfo-1 Nei

Kombinasi Forward/Reverse Genetics

Reverse Genetics(outcome: phenotype)

hipotesis validasi

Forward Genetics(outcome: genotype)

Page 37: bioinfo-1 Nei

Database Bionformatika & Situs NCBI

Page 38: bioinfo-1 Nei

Database

• Database primer/utama (primary)• Database sekunder (secondary)• Database tertier/special (tertiary)• Database literatur

Page 39: bioinfo-1 Nei

Database primer/utama

Data repository

Raw data

Redundant

Direct submision ( “sampah”, inkonsistensi, dll)

Selalu di-update (daily/weekly)

Contoh:NCBI Genbank (sekuen DNA dan translasinya)SwissProt (sekuen protein)PDB (struktur kristal protein dan makromolekul)dbEST (potongan-potongan sekuen mRNA)dbGSS (survei sekuen genom)Trace Archive (data hasil sekuensing DNA)SAGEMap, GEO (data eksperimen microarray)

Page 40: bioinfo-1 Nei

Database sekunder

Knowledge repository

Bersumber dari database primer/utama

Data dianotasi oleh kurator (umumnya manual)

Non-redundant

Ada jeda waktu untuk sinkronisasi dengan sumber database primer

Contoh:NCBI RefSeq (sekuen DNA dan translasinya)SwissProt (sekuen protein)Ensembl (sekuen genom eukaryotes)MMDB (struktur kristal protein dan makromolekul)

Page 41: bioinfo-1 Nei

Database tertier/spesial

Bersumber dari database primer & sekunder

Mencakup data non-biomolekuler

Kenyamanan end-user

Banyak kurator

Jeda waktu sinkronisasi dengan database primer/sekunder yang lama

Contoh:EuPathDB (database patogen eukaryotes, seperti Plasmodium, dsb)MitoMAP (database mapping genome mitochodria)Mammalian ncRNA (sekuen ncRNA dari mamalia)REBASE (database enzim restriksi)SGD (database jamur/fungi)Globin Server (protein globin dan penyakit thalassemia)KEGG (database pathway, dsb)

Page 42: bioinfo-1 Nei

Database literatur

PubMed (http://www.ncbi.nih.gov/pubmed)

Jurnal internasional bidang ilmu alam & kedokteran

Abstrak, Penulis, Jurnal

PubMed Central (http://www.pubmedcentral.nih.gov)

Subset dari PubMed

Full-text

NCBI Bookshelf (http://www.ncbi.nih.gov/books)

NCBI OMIM - Online Mendelian Inheritance in Man

Katalog dari penyakit genetik dan gen manusia (& tikus)

NCBI OMIA (Online Mendelian Inheritance in Animal

Katalog dari penyakit genetik dan gen hewan (selain manusia & tikus)

Page 43: bioinfo-1 Nei

Daftar (sebagian kecil) Database Bioinformatika

MitoMAP

GenBankEMBLDDJ

SwissProt PDB

Pubmed

Prosite

PFAM

EnsEMBL GenomeBrowser

SGD

TrEMBL

PRINTS

InterPro

dbEST

dbSNP

primary databases

ProDom

Blocks

PFAM

PlasmoDB

HSSP

SCOP

CATH

DSSPSMD

secondary databases

TIGR

REBASE

KEGG

OMIM

Page 44: bioinfo-1 Nei

NCBI ( www.ncbi.nih.gov )

• Pencarian literatur• Pencarian gen berdasarkan:

– Informasi tekstual (nama, lokasi, literatur)– Sekuen lain– Struktur

• Pencarian data lain:– OMIM – Online Mendelian Inheritance in Man– TaxBrowser– dbSNP – SNP database– dbGAP – Genotype-Phenotype database– UniSTS – Sequence Tag Site

• Repositori untuk GenBank & RefSeq• Repositori untuk full genomic sequences• Repositori untuk dokumen edukasi• Bioinformatics tools: Electronic PCR, dll

Page 45: bioinfo-1 Nei

NCBI Genbank Database

Page 46: bioinfo-1 Nei

Nomenclature NCBI Refseq

NM_* RefSeq untuk coding sequence (mRNA)

NR_* RefSeq untuk non-coding RNA yang ditranskripkan

NT_* RefSeq untuk genomic contig dari kromosom

NW_* RefSeq untuk alternatif genomic contig dari kromosom

NG_* RefSeq untuk famili/cluster atau pseudo-gene

NC_* RefSeq untuk full/circular genome

NP_* RefSeq untuk sekuen protein

XM_* RefSeq untuk sekuen hypothetical mRNA

XP_* RefSeq untuk sekuen hypothetical protein

Page 47: bioinfo-1 Nei

ENTREZ

• ENTREZ: interface search/query dari (hampir) seluruh database di NCBI

• Interkoneksi antar (hampir) seluruh database• Pencarian dengan Entrez dapat dilengkapi

dengan sistem history• History dapat digabung untuk mendapatkan

kueri baru• Entrez dilengkapi dengan tools untuk mengubah

format data

Page 48: bioinfo-1 Nei

Database pada NCBI (1)

• PubMed• Protein translasi dari Nucleotide• CoreNucleotide Genbank + Refseq• Nucleotide CoreNucleotide + EST + GSS + STS

– EST (Expressed Sequence Tags) – mRNA– GSS (Genome Survey Sequence) – preliminary genome– STS (Sequence Tag Site) – sekuen DNA pendek yang hanya muncul di

satu lokasi saja pada genome

• Structure :– MMDB – Molecular Modeling Database subset dari PDB – CDD – Conserved Domain Database– VAST – Vector Alignment Search Tool pencarian struktur berdasarkan

kemiripan pada struktur kueri

Page 49: bioinfo-1 Nei

Database pada NCBI (2)

• Genome full atau partial annotated genome dari tiap spesies

• Books database literatur / text-book / etc• CancerChromosomes data mengenai kanker:

– Cytogenetics– Klinis– referensi

• ConservedDomains• 3D Domains

Page 50: bioinfo-1 Nei

Database pada NCBI (3)

• Gene• Genome Project• dbGAP database Genotype and Phenotype• GENSAT (Gene Expression Nervous System Atlas) database

ekspresi gen dari sistem saraf pusat (central nervous system) padamouse dengan metode in-situ hybridization dan transgenik

• GEO (Gene Expression Omnibus) database ekspresi gen darieksperimen microarray

• HomoloGene data gen-gen homolog yang dianalisa secaraotomatis

• PMC – PubMed Central• MeSH

Page 51: bioinfo-1 Nei

Database pada NCBI (4)

• OMIA & OMIM – Online Mendelian Inheritance database• PopSet data populasi dari berbagai studi• PubChem database struktur kimia biomolekul selain

protein• SNP (Single Nucleotide Polymorphism) database

variasi pada sekuen dari tiap gen• Taxonomy• UniGene data gen yang telah dianotasi dan

diorganisir• UniSTS data STS yang telah dianotasi

Page 52: bioinfo-1 Nei

Anotasi Gen

• Kumpulan informasi yang relevan• Didapat dan diverifikasi dari eksperimen (diambil dari jurnal-jurnal

penelitian) secara manual• Informasinya antara lain:

– Organisme/sampel– Organelle– Lokasi kromosom beserta orientasinya– Daerah enhancer, promoter, exon-intron– Transkrip (beserta alternatifnya) dan proteinnya– Variasi dari gen (SNP)– Fungsi– Motif / pattern dari proteinnya– Korelasi phenotype / penyakit– Informasi lainnya

Page 53: bioinfo-1 Nei

Anotasi Gen

Page 54: bioinfo-1 Nei

Format Genbank

LOCUS DQ372051 370 bp DNA linear PRI 13-FEB-2006DEFINITION Homo sapiens isolate Nabila 1 control region, partial sequence;

mitochondrial.ACCESSION DQ372051VERSION DQ372051.1 GI:87047615KEYWORDS .SOURCE mitochondrion Homo sapiens (human)ORGANISM Homo sapiens

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi;Mammalia; Eutheria; Euarchontoglires; Primates; Catarrhini;Hominidae; Homo.

REFERENCE 1 (bases 1 to 370)AUTHORS Faghfoor,N.F.TITLE PCR Amplification and Sequencing of Hypervariable Region 1 of the

Mitochondrial DNA Control RegionJOURNAL Unpublished

REFERENCE 2 (bases 1 to 370)AUTHORS Faghfoor,N.F.TITLE Direct SubmissionJOURNAL Submitted (21-JAN-2006) Biochemistry/Biotechnology, University of

Southern California, Los Angeles, CA, USAFEATURES Location/Qualifiers

source 1..370/organism="Homo sapiens"/organelle="mitochondrion"/mol_type="genomic DNA"/isolate="Nabila 1"/db_xref="taxon:9606"/collection_date="2005"

misc_feature <1..>370/note="control region; hypervariable region 1"

ORIGIN1 ctgttctttc atggggaagc agatttgggt accacccaag tattgactcc cccatcaaca61 accgctatgt atttcgtaca ttactgccag ccaccatgaa tattgtacgg taccataaat

121 acttgaccac ctgtagtaca taaaaaccca atccacatca aaaccccctc cccatgctta181 caagcaagta cagcaatcaa ccctcaacta tcacacatca actgcaactc caaagccacc241 cctcacccac taggatacca acaaacctac ccacccttaa cagtacatag tacataatgc301 catttaccgt acatagcaca ttacagtcaa atcccttctc gtccccatgg atgacccccc361 tcagataggg

//

Page 55: bioinfo-1 Nei

Format FASTA>referenceMASDSGNQGTLCTLEFAVQMTCQSCVDAVRKSLQGVAGVQDVEVHLEDQMVLVHTTLPSQEVQALLEGTGRQAVLKGMGSGQLQNLGAAVAILGGPGTVQGVVRFLQLTPERCLIEGTIDGLEPGLHGLHVHQYGDLTNNCNSCGNHFNPDGASHGGPQDSDRHRGDLGNVRADADGRAIFRMEDEQLKVWDVIGRSLIIDEGEDDLGRGGHPLSKITGNSGERLACGIIARSAGLFQNPKQICSCDGLTIWEERGRPIAGKGRKESAQPPAHL>normal_1MASDSGNQGTLCTLEFAVQMTCQSCVDAVRKSLQGVAGVQDVEVHLEDQMVLVHTTLPSQEVQALLEGTGRQAVLKGMGSGQLQNLGAAVAILGGPGTVQGVVRFLQLTPERCLIEGTIDGLEPGLHGLHVHQYGDLTNNCNSCGNHFNPDGASHGGPQDSDRHRGDLGNVRADADGRAIFRMEDEQLKVWDVIGRSLIIDEGEDDLGRGGHPLSKITGNSGERLACGIIARSAGLFQNPKQICSCDGLTIWEERGRPIAGKGRKESAQPPAHL>normal_2MASDSGNQGTLCTLEFAVQMTCQSCVDAVRKSLQGVAGVQDVEVHLEDQMVLVHTTLPSQEVQALLEGTGRQAVLKGMGSGQLQNLGAAVAILGGPGTVQGVVRFLQLTPERCLIEGTIDGLEPGLHGLHVHQYGDLTNNCNSCGNHFNPDGASHGGPQDSDRHRGDLGNVRADADGRAIFRMEDEQLKVWDVIGRSLIIDEGEDDLGRGGHPLSKITGNSGERLACGIIARSAGLFQNPKQICSCDGLTIWEERGRPIAGKGRKESAQPPAHL>pasien_1MASDSGNQGTLCTLEFAVQMTCQSCVDAVRKSLQGVAGVQDVEVHLEDQMVLVHTTLPSQEVQALLEGTGRQAVLKGMGSGQLQNLGAAVAILGGPGTVQGVVRFLQLTPERCLIEGTIDGLEPGLHGLHVHQYGDLTNNCNSCGNHFNPDGASHGGPQDSDRHRGDLGNVRADADGRAIFRMEDEQLKVWDVIGRSLIIDEGEDDLGRGGHPLSKITGNSGERLACGIIARSAGLFQNPKQICSCDGLTIWEERGRPIAGKGRKESAQPPAHL>pasien_2MASDSGNQGTLCTLEFAVQMTCQSCVDAVRKSLQGVAGVQDVEVHLEDQMVLVHTTLPSQEVQALLEGTGRQAVLKGMGSGQLQNLGAAVAILGGPGTVQGVVRFLQLTPERCLIEGTIDGLEPGLHGLHVHQYGDLTNNCNSCGNHFNPDGASHGGPQDSDRHRGDLGNVRADADGRAIFRMEDEQLKVWDVIGRSLIIDEGEDDLGRGGHPLSKITGNSGERLACGIIARSAGLFQNPKQICSCDGLTIWEERGRPIAGKGRKESAQPPAHL

Page 56: bioinfo-1 Nei

Analisa sekuen dan struktur

• Desain primer• Studi homologi• Prediksi struktur sekunder protein• Prediksi topologi protein

Sekuen DNA:GATCGCTAGGATCGAGCTAGGATCGCGGATCCGAGAGCTCGAGGGCGCTAGCGCTAGCTCGATCGACTG

Sekuen protein (hasil translasi sekuen di atas):DR*DRARIADPRARGR*R*LDRL Frame +1IARIELGSRIRELEGASASSID Frame +2SLGSS*DRGSESSRALALARST Frame +3

Page 57: bioinfo-1 Nei

Desain Primer & Probe

Desain primer secara otomatis

Primer3, PerlPrimer

Verifikasi oligonucleotides

NetPrimer, PerlPrimer

Desain degenerate-primer

CODEHOP

Primer harus dicek kembali (BLAST, ...)