Seminario "Efficient de novo assembly of single-cell bacterial genomes from short-read data sets"

46
UNIVERSIDADE FEDERAL DO PARÁ INSTITUTO DE CIÊNCIAS BIOLÓGICAS Edson Silva BELÉM-PA 2014

description

Efficient de novo assembly of single-cell bacterial genomes from short-read data sets - Chitsaz H. et al (2011)

Transcript of Seminario "Efficient de novo assembly of single-cell bacterial genomes from short-read data sets"

Page 1: Seminario "Efficient de novo assembly of single-cell bacterial genomes from short-read data sets"

UNIVERSIDADE FEDERAL DO PARÁINSTITUTO DE CIÊNCIAS BIOLÓGICAS

Edson Silva

BELÉM-PA2014

Page 2: Seminario "Efficient de novo assembly of single-cell bacterial genomes from short-read data sets"

Efficient de novo assembly of single-cell bacterial genomes from short-read data sets

Chitsaz H. et al (2011)

Page 3: Seminario "Efficient de novo assembly of single-cell bacterial genomes from short-read data sets"

INTRODUÇÃO

Page 4: Seminario "Efficient de novo assembly of single-cell bacterial genomes from short-read data sets"

Introdução

● Metagenômica ● MDA (Multiple Displacement Amplification)● Amplificação de viés e formação de Chimeras● Cobertura do sequenciamento ajuda aliviar o

problema

Page 5: Seminario "Efficient de novo assembly of single-cell bacterial genomes from short-read data sets"

Introdução

● O total potencial de montagens single-cell ainda não foi alcançado

● Desafios são mais computacionais do que experimentais

Page 6: Seminario "Efficient de novo assembly of single-cell bacterial genomes from short-read data sets"

Introdução

● Cobertura não uniformes● Necessidade de adaptar as ferramentas de

montagens

Velvet Velvet-SC

Page 7: Seminario "Efficient de novo assembly of single-cell bacterial genomes from short-read data sets"

Introdução

● Aplicado à 2 genomas conhecidos e 1 desconhecido

● Identificando a maioria dos genes com nenhum esforço no fechamento de gaps e resolução de repeats

SILVA[2012]

Page 8: Seminario "Efficient de novo assembly of single-cell bacterial genomes from short-read data sets"

RESULTADOS

Page 9: Seminario "Efficient de novo assembly of single-cell bacterial genomes from short-read data sets"

Velvet-SC improves assembly of short reads with highly nonuniform

coverage

● Velvet poda regiões de baixa cobertura● Velvet-SC● EULER+Velvet-SC

Page 10: Seminario "Efficient de novo assembly of single-cell bacterial genomes from short-read data sets"

Characteristics of single-cell sequences

● DNA amplificado: Escherichia coli (lane 1 e lane 6) e Staphylococcus aureus

● Chimeras: 2% E. coli read pairs e 5% S. aureus read pairs

Page 11: Seminario "Efficient de novo assembly of single-cell bacterial genomes from short-read data sets"

Characteristics of single-cell sequences

● Alta não uniformidade de cobertura● Blackout● As regiões de blackout podem ser eliminadas por

combinação de reads de múltiplas single-cell

Page 12: Seminario "Efficient de novo assembly of single-cell bacterial genomes from short-read data sets"

Characteristics of single-cell sequences

Data sets ~600x(Blackout)

0x ou 1x(kbp)

~2,300x(Blackout)

0x ou 1x(bases)

E. coli lane 1 94 ~116 - -

E. coli lane 6 50 ~13 - -

S. aureus - - 2 143

Page 13: Seminario "Efficient de novo assembly of single-cell bacterial genomes from short-read data sets"

De novo single-cell assembly of E. coli and S. aureus

● Velvet, Velvet-SC e EULER+Velvet-SC foram comparados

● Fração selecionada aleatoriamente de reads de entrada variando de 0.1 à 0.9 do total e montado com EULER+Velvet-SC e Velvet

Page 14: Seminario "Efficient de novo assembly of single-cell bacterial genomes from short-read data sets"

De novo single-cell assembly of E. coli and S. aureus

● Aumento da cobertura gerou os melhores resultados ● EULER+Velvet-SC superou o Velvet para o total

de pb montadas em todas as coberturas

Page 15: Seminario "Efficient de novo assembly of single-cell bacterial genomes from short-read data sets"

CHITSAZ[2011, p.917]

Page 16: Seminario "Efficient de novo assembly of single-cell bacterial genomes from short-read data sets"

Single-cell assembly of an uncultured Deltaproteobacterium

● La Jolla, California● Análise filogenética de sequencias (16S) revelou

que esse organismo é membro da não cultivável Deltaproteobacteria, chamada SAR324

Page 17: Seminario "Efficient de novo assembly of single-cell bacterial genomes from short-read data sets"

Single-cell assembly of an uncultured Deltaproteobacterium

● SAR324_MDA reads● 57,816,790 de 67,995,232 reads passaram pelo

filtro de pureza do Illumina

Page 18: Seminario "Efficient de novo assembly of single-cell bacterial genomes from short-read data sets"

Assembly statistic

CHITSAZ[2011, p.919]

Page 19: Seminario "Efficient de novo assembly of single-cell bacterial genomes from short-read data sets"

Assembly statistic

● MetaGene● Rendeu ao EULER+Velvet-SC um conjunto mais

robusto para a anotação

Page 20: Seminario "Efficient de novo assembly of single-cell bacterial genomes from short-read data sets"

Assembly purity

● A contaminação no SAR324_MDA foi analisada pelo conteúdo GC, frequências de nucleotídeos das reads e contigs comparando com as referências de genomas bacteriabacteriano e o BLAST

Page 21: Seminario "Efficient de novo assembly of single-cell bacterial genomes from short-read data sets"

Assembly purity

● Árvore filogenética para cada ORF (Open Reading Frame) usando o APIS (Automated Phylogenetic Inference System)

Page 22: Seminario "Efficient de novo assembly of single-cell bacterial genomes from short-read data sets"

Assembly purity

● APIS pode ser usado para a identificação de contigs contaminantes

● SAR324 possui dados filogenéticos inconsistentes

Page 23: Seminario "Efficient de novo assembly of single-cell bacterial genomes from short-read data sets"

Insights from the SAR324_MDA Deltaproteobacterium genome

● Características mais marcantes da montagem SAR324 é a presença de 18 Phytanoyl Dioxygenase

● Catalisam a degradação da cadeia lipídica em clorofila

Page 24: Seminario "Efficient de novo assembly of single-cell bacterial genomes from short-read data sets"

Insights from the SAR324_MDA Deltaproteobacterium genome

● Características metabólicas de SAR324 sugerem que elas rastreiam e degradam afundando biomassa fotossintética

● Deixa a superfície do oceano iluminado pelo sol

Page 25: Seminario "Efficient de novo assembly of single-cell bacterial genomes from short-read data sets"

Insights from the SAR324_MDA Deltaproteobacterium genome

● SAR324– Cosmopolita

– Aeróbico – ATP através de O2 e C6H12O6

– Móvel – utiliza flagelos

– Quimiotáxico – processo de locomoção de células em direção a um gradiente químico

Page 26: Seminario "Efficient de novo assembly of single-cell bacterial genomes from short-read data sets"

DISCUSSÃO

Page 27: Seminario "Efficient de novo assembly of single-cell bacterial genomes from short-read data sets"

Discussão

● Não uniformidade da cobertura● Validação do EULER-SR + Velvet-SC com

genomas de referência● Método apresentou sucesso

Page 28: Seminario "Efficient de novo assembly of single-cell bacterial genomes from short-read data sets"

Discussão

● O rápido desenvolvimento de tecnologias de sequenciamento e a redução dos custos também prometem acelerar o processo

Page 29: Seminario "Efficient de novo assembly of single-cell bacterial genomes from short-read data sets"

Discussão

● Maior meta da genômica única célula é complementar o seu largo volume da dados metagenômicos com montagens de genomas de organismos não cultiváveis que suportam a anotação da maioria dos genes

Page 30: Seminario "Efficient de novo assembly of single-cell bacterial genomes from short-read data sets"

Discussão

● Essa tecnologia guiará estudos de organismos não cultiváveis para o microbioma humano e para o marinho e ambientes de solo

Page 31: Seminario "Efficient de novo assembly of single-cell bacterial genomes from short-read data sets"

Discussão

● O custo-benefício da abordagem contribui para exploração da taxonomia microbiana, evolução e extração de organismos ambientais

● Biotecnologia e biomedicina

Page 32: Seminario "Efficient de novo assembly of single-cell bacterial genomes from short-read data sets"

Discussão

● Prever um maior desenvolvimento de EULER + Velvet-SC

● Metagenômica e transcriptoma, que também são caracterizadas por uma cobertura altamente não uniforme

Page 33: Seminario "Efficient de novo assembly of single-cell bacterial genomes from short-read data sets"

MÉTODOS

Page 34: Seminario "Efficient de novo assembly of single-cell bacterial genomes from short-read data sets"

Velvet-SC: modifications to Velvet assembly algorithm

● Sequências mescladas em um contig maior● Normalmente funde regiões de baixa cobertura com

as de altas coberturas, resgatando assim, regiões de baixa cobertura da eliminação

Page 35: Seminario "Efficient de novo assembly of single-cell bacterial genomes from short-read data sets"

EULER+Velvet-SC is EULER-SR's error correction combined with

Velvet-SC

● Geradas reads de MDAs feitas nas células (E. coli e S. aureus)

● 600x e 2,300x de cobertura● 100-bp● Executando no Illumina Genome Analyzer IIx

Page 36: Seminario "Efficient de novo assembly of single-cell bacterial genomes from short-read data sets"

Single-cell isolation

● E. coli e S. aureus foram isoladas por micromanipulação

● Amostra de célula marinha (La Jolla, Califórnia) foi filtrada, rapidamente congeladas e armazenadas a -80 ° C em 30% de glicerol

Page 37: Seminario "Efficient de novo assembly of single-cell bacterial genomes from short-read data sets"

MDA and selection of candidate marine amplified DNA

● Reagente GenomiPhi HY● O gene rRNA 16S foi amplificado e sequenciado e

MDA marinho de interesse foi selecionado por análises BLAST de suas sequências 16S

Page 38: Seminario "Efficient de novo assembly of single-cell bacterial genomes from short-read data sets"

Library generation and sequencing

● Illumina Genome Analyzer IIx usando reagentes padrões

Data sets Library

E. coli lane 1 Paired-end

E. coli lane 6 Paired-end

S. aureus PCR-free paired-end

Deltaproteobacteria PCR-free paired-end

Page 39: Seminario "Efficient de novo assembly of single-cell bacterial genomes from short-read data sets"

Analysis and annotation of the single-cell assembly

● Contigs analizadas pelo BLAST contra um banco de dados de sequência de nucleotídeos com entrada de GenBank e RefSeq

● Anotação de genes ORFs, tRNAs, rRNA foi realizado usando o pipeline de anotação metagenômica JCVI ( J. Craig Venter Institute)

Page 40: Seminario "Efficient de novo assembly of single-cell bacterial genomes from short-read data sets"

Analysis and annotation of the single-cell assembly

● Análises filogenéticas de seleção de proteínas foram conduzidas no Bosque (Integrated phylogenetic analysis software)

● Identificadores de genes utilizados em KEGG (Kyoto Encyclopedia of Genes and Genomes) Automatic Annotation Server (KAAS)

Page 41: Seminario "Efficient de novo assembly of single-cell bacterial genomes from short-read data sets"
Page 42: Seminario "Efficient de novo assembly of single-cell bacterial genomes from short-read data sets"

OBRIGADO!

Page 43: Seminario "Efficient de novo assembly of single-cell bacterial genomes from short-read data sets"

Referência

● CHITSAZ, Hamidreza. et al. Efficient de novo assembly of single-cell bacterial genomes from short-read data sets. Nature Biotechnology, Volume 29, Number 10, October 2011.

● SILVA, Artur. et al. Next-Generation Sequencing and Assembly of Bacterial Genomes. 2012.

● MetaGene <http://metagene.cb.k.u-tokyo.ac.jp/metagene/metagene.html>. Acessado em: 16/09/2014.

● SAR324 cluster bacterium JCVI-SC AAA005, whole genome shotgun sequencing project <http://www.ncbi.nlm.nih.gov/nuccore/AGAU00000000.1>. Acessado em: 16/09/2014.

Page 44: Seminario "Efficient de novo assembly of single-cell bacterial genomes from short-read data sets"

SLIDES RESERVAS

Page 45: Seminario "Efficient de novo assembly of single-cell bacterial genomes from short-read data sets"
Page 46: Seminario "Efficient de novo assembly of single-cell bacterial genomes from short-read data sets"

CHITSAZ[2011, p.919]