Genome Browser

Post on 08-May-2015

1.784 views 2 download

description

UCSC, NCBI MapView, Ensembl, Gbrowse

Transcript of Genome Browser

GenomeBrowser

Center for Genome Science, NIH, KCDCHong ChangBum

hongiiv@gmail.com

GenomeBrowser

우리는 그들을 홍콩의4대천황으로 기억합니다.

잘 보세요, 이제부터

Genome Browser4대 천황을 소개합니다.

그럼, GenomeBrowser는 무엇인가요?

분자생물학자들에게 그들이 웹에서 인간

과 쥐의 유전체에 대해 질문할 수 있는 첫번째 장소가 되기를 바랍니다. 분자생물학자

들이 엉망진창인 데이터를 추적하느라 아까운 시간을

소비하지 않고 그들에게 흥미로운 것들을 신속히 발견하고 그래서 실제적인 실험을 계획하고 진행할 수 있도록 훌륭한 웹사이트에서 시간을 보낼 수 있기를 바랍니

다.

Ensembl 인간 유전체 서버 프로젝트는 무엇인지 자세히 설명 부탁드립니다.

An Interview with Ewan Birney: Keynote Speaker at O’Relly’s Bioinformatics Technology Conference 2001/10

UCSCGenomeBrowser

EnsEMBL

NCBIMapViewser

GBrowse

Oops!!!!

잠깐실망하고갑

시다.

KSNPDBBrowser

kGeneDBBrowser

LesVisiteurs

•UCSC Human Genome Browser

•50,000 Hit/Day

•3,000 users/Day

•보건의료유전체사업정보•1,257 Hit/Day

•10 users/Day

Code Name : AcuvueObjective: 하루만에 끝내버리자!

KAREData(3.07GB)

9,604Rows

500,000Cols

KAREDataBaseScheme

1

2

3

DataBaseTables

KAREBrowser

Google Maps API 기반의 이미지 데이터 Presentation

외부 Reference LinkSNP Population 정보

JustRight-LincolnStein

GMODGbrowse

•Part of Generic Model Organism Database Project•Lightweight & portable•Highly configurable•Clean user interface•Promotes data sharing

BrowsingaRegionoftheGenome

•Find your Favorite Gene•Find your Favorite Domain•Find your Favorite Oligo•Zoom - Low Magnification•Zoom - Medium Magnification•Zoom - High Magnification•Zoom - Highest Magnification•Custom Tracks

ExtensivelyCustomizable

•End-user•Turn tracks on and off, change order, change packing & labeling attributes(stored in cookie)

•Data provider•Change fonts, colors, text.•Change overview-genetic map, contigs, coverage, karyotype.•Define new tracks using simple config file.•Tinker with track appearance to hearts content.

ExtensivelyExtensible

DAS Adaptor

Remote Source

Glyphs

DataSharing

•Add your own tracks•Add 3d party tracks•Distributed annotation system support

AddingyourOwnTracks

Internationalization

Adding3dPartyTracks

GbrowseonRemoteSources

DAS Adaptor

UCSC Genome Browser

Glyphs

DAS•Gbrowse on UCSC•Gbrowse on EnsEMBL•Gbrowse on both

DistributedGBrowse

Gbrowse 1

Gbrowse 2

Gbrowse 3

My Gbrowse

GbrowseInternals

•BioPerl and Bio::Graphics Software Libraries•Bio::DB::GFF Database•GadFly Database •Plug-ins

GFF3andBio::DB::GFFDatabaseseqid source type start end score strand phase attributeChr1 dbsnp snp 200 300 . + . ID=SNP:rs1234;alleles:G/TChr1 dbsnp snp 400 700 . + . ID=SNP:rs4321;alleles:G/T

!"!"#$

#$%&'%()%&%

We

Know

Spatial

Data

1

2 3 4 5

6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21

A B C(1,2,3,7,8,9,10,11) (1,4,14,15,16,17) (1,5,20)

BinningScheme(R-Tree)

>400-foldfaster

ConfiguringGbrowse

Installation

•“One Click” install on Macintosh OSX•“Three Click” install on Windows XP•“Tippity-tappity-tap” install on Linux/Solaris/BSD Unix

10 %

데이터

충분한 대역폭

협력체계 구축

하드웨어

외적 요소

훌륭한 Genome Browser의 조건

내적 요소

이미지

연구 개발을 위한 개방된 인프라스트럭처

서비스 안정성

대용량 데이터 처리

코드의 재사용성

알고리즘

데이터베이스 디자인

90 %

사용성

!"#$%&'()*!'+,-.#&!"#"$%&"'()*&$+,-.#/,'(

/++0122"3#4-!'5*"#$%&'(-(*+

!"0*$1,.23"'

4.*(#/,'(5Questions?

Hong ChangBumCenter for Genome ScienceNIH, KCDChongiiv@gmail.comhttp://socmaster.homelinux.org/~hongiiv