Seminario "Efficient de novo assembly of single-cell bacterial genomes from short-read data sets"
-
Upload
edson-silva -
Category
Science
-
view
142 -
download
2
description
Transcript of Seminario "Efficient de novo assembly of single-cell bacterial genomes from short-read data sets"
UNIVERSIDADE FEDERAL DO PARÁINSTITUTO DE CIÊNCIAS BIOLÓGICAS
Edson Silva
BELÉM-PA2014
Efficient de novo assembly of single-cell bacterial genomes from short-read data sets
Chitsaz H. et al (2011)
INTRODUÇÃO
Introdução
● Metagenômica ● MDA (Multiple Displacement Amplification)● Amplificação de viés e formação de Chimeras● Cobertura do sequenciamento ajuda aliviar o
problema
Introdução
● O total potencial de montagens single-cell ainda não foi alcançado
● Desafios são mais computacionais do que experimentais
Introdução
● Cobertura não uniformes● Necessidade de adaptar as ferramentas de
montagens
Velvet Velvet-SC
Introdução
● Aplicado à 2 genomas conhecidos e 1 desconhecido
● Identificando a maioria dos genes com nenhum esforço no fechamento de gaps e resolução de repeats
SILVA[2012]
RESULTADOS
Velvet-SC improves assembly of short reads with highly nonuniform
coverage
● Velvet poda regiões de baixa cobertura● Velvet-SC● EULER+Velvet-SC
Characteristics of single-cell sequences
● DNA amplificado: Escherichia coli (lane 1 e lane 6) e Staphylococcus aureus
● Chimeras: 2% E. coli read pairs e 5% S. aureus read pairs
Characteristics of single-cell sequences
● Alta não uniformidade de cobertura● Blackout● As regiões de blackout podem ser eliminadas por
combinação de reads de múltiplas single-cell
Characteristics of single-cell sequences
Data sets ~600x(Blackout)
0x ou 1x(kbp)
~2,300x(Blackout)
0x ou 1x(bases)
E. coli lane 1 94 ~116 - -
E. coli lane 6 50 ~13 - -
S. aureus - - 2 143
De novo single-cell assembly of E. coli and S. aureus
● Velvet, Velvet-SC e EULER+Velvet-SC foram comparados
● Fração selecionada aleatoriamente de reads de entrada variando de 0.1 à 0.9 do total e montado com EULER+Velvet-SC e Velvet
De novo single-cell assembly of E. coli and S. aureus
● Aumento da cobertura gerou os melhores resultados ● EULER+Velvet-SC superou o Velvet para o total
de pb montadas em todas as coberturas
CHITSAZ[2011, p.917]
Single-cell assembly of an uncultured Deltaproteobacterium
● La Jolla, California● Análise filogenética de sequencias (16S) revelou
que esse organismo é membro da não cultivável Deltaproteobacteria, chamada SAR324
Single-cell assembly of an uncultured Deltaproteobacterium
● SAR324_MDA reads● 57,816,790 de 67,995,232 reads passaram pelo
filtro de pureza do Illumina
Assembly statistic
CHITSAZ[2011, p.919]
Assembly statistic
● MetaGene● Rendeu ao EULER+Velvet-SC um conjunto mais
robusto para a anotação
Assembly purity
● A contaminação no SAR324_MDA foi analisada pelo conteúdo GC, frequências de nucleotídeos das reads e contigs comparando com as referências de genomas bacteriabacteriano e o BLAST
Assembly purity
● Árvore filogenética para cada ORF (Open Reading Frame) usando o APIS (Automated Phylogenetic Inference System)
Assembly purity
● APIS pode ser usado para a identificação de contigs contaminantes
● SAR324 possui dados filogenéticos inconsistentes
Insights from the SAR324_MDA Deltaproteobacterium genome
● Características mais marcantes da montagem SAR324 é a presença de 18 Phytanoyl Dioxygenase
● Catalisam a degradação da cadeia lipídica em clorofila
Insights from the SAR324_MDA Deltaproteobacterium genome
● Características metabólicas de SAR324 sugerem que elas rastreiam e degradam afundando biomassa fotossintética
● Deixa a superfície do oceano iluminado pelo sol
Insights from the SAR324_MDA Deltaproteobacterium genome
● SAR324– Cosmopolita
– Aeróbico – ATP através de O2 e C6H12O6
– Móvel – utiliza flagelos
– Quimiotáxico – processo de locomoção de células em direção a um gradiente químico
DISCUSSÃO
Discussão
● Não uniformidade da cobertura● Validação do EULER-SR + Velvet-SC com
genomas de referência● Método apresentou sucesso
Discussão
● O rápido desenvolvimento de tecnologias de sequenciamento e a redução dos custos também prometem acelerar o processo
Discussão
● Maior meta da genômica única célula é complementar o seu largo volume da dados metagenômicos com montagens de genomas de organismos não cultiváveis que suportam a anotação da maioria dos genes
Discussão
● Essa tecnologia guiará estudos de organismos não cultiváveis para o microbioma humano e para o marinho e ambientes de solo
Discussão
● O custo-benefício da abordagem contribui para exploração da taxonomia microbiana, evolução e extração de organismos ambientais
● Biotecnologia e biomedicina
Discussão
● Prever um maior desenvolvimento de EULER + Velvet-SC
● Metagenômica e transcriptoma, que também são caracterizadas por uma cobertura altamente não uniforme
MÉTODOS
Velvet-SC: modifications to Velvet assembly algorithm
● Sequências mescladas em um contig maior● Normalmente funde regiões de baixa cobertura com
as de altas coberturas, resgatando assim, regiões de baixa cobertura da eliminação
EULER+Velvet-SC is EULER-SR's error correction combined with
Velvet-SC
● Geradas reads de MDAs feitas nas células (E. coli e S. aureus)
● 600x e 2,300x de cobertura● 100-bp● Executando no Illumina Genome Analyzer IIx
Single-cell isolation
● E. coli e S. aureus foram isoladas por micromanipulação
● Amostra de célula marinha (La Jolla, Califórnia) foi filtrada, rapidamente congeladas e armazenadas a -80 ° C em 30% de glicerol
MDA and selection of candidate marine amplified DNA
● Reagente GenomiPhi HY● O gene rRNA 16S foi amplificado e sequenciado e
MDA marinho de interesse foi selecionado por análises BLAST de suas sequências 16S
Library generation and sequencing
● Illumina Genome Analyzer IIx usando reagentes padrões
Data sets Library
E. coli lane 1 Paired-end
E. coli lane 6 Paired-end
S. aureus PCR-free paired-end
Deltaproteobacteria PCR-free paired-end
Analysis and annotation of the single-cell assembly
● Contigs analizadas pelo BLAST contra um banco de dados de sequência de nucleotídeos com entrada de GenBank e RefSeq
● Anotação de genes ORFs, tRNAs, rRNA foi realizado usando o pipeline de anotação metagenômica JCVI ( J. Craig Venter Institute)
Analysis and annotation of the single-cell assembly
● Análises filogenéticas de seleção de proteínas foram conduzidas no Bosque (Integrated phylogenetic analysis software)
● Identificadores de genes utilizados em KEGG (Kyoto Encyclopedia of Genes and Genomes) Automatic Annotation Server (KAAS)
OBRIGADO!
Referência
● CHITSAZ, Hamidreza. et al. Efficient de novo assembly of single-cell bacterial genomes from short-read data sets. Nature Biotechnology, Volume 29, Number 10, October 2011.
● SILVA, Artur. et al. Next-Generation Sequencing and Assembly of Bacterial Genomes. 2012.
● MetaGene <http://metagene.cb.k.u-tokyo.ac.jp/metagene/metagene.html>. Acessado em: 16/09/2014.
● SAR324 cluster bacterium JCVI-SC AAA005, whole genome shotgun sequencing project <http://www.ncbi.nlm.nih.gov/nuccore/AGAU00000000.1>. Acessado em: 16/09/2014.
SLIDES RESERVAS
CHITSAZ[2011, p.919]