Introduction of RefSeq and LocusLink: resources at the NCBI Magno Inácio dos Santos.

15
Introduction of RefSeq Introduction of RefSeq and LocusLink: and LocusLink: resources at the NCBI resources at the NCBI Magno Inácio Magno Inácio dos Santos dos Santos

Transcript of Introduction of RefSeq and LocusLink: resources at the NCBI Magno Inácio dos Santos.

Page 1: Introduction of RefSeq and LocusLink: resources at the NCBI Magno Inácio dos Santos.

Introduction of RefSeq and Introduction of RefSeq and LocusLink: resources at LocusLink: resources at

the NCBIthe NCBI

Magno Inácio dos SantosMagno Inácio dos Santos

Page 2: Introduction of RefSeq and LocusLink: resources at the NCBI Magno Inácio dos Santos.

ArtigosArtigos

Introducing refSeq and LocusLink: Introducing refSeq and LocusLink: curated human genome resources at curated human genome resources at the NCBIthe NCBI

RefSeq and LocusLink: NCBI gene-RefSeq and LocusLink: NCBI gene-centered resourcescentered resources

Trends in Genetics,2000, Vol.16, No.1, pg.44-47Trends in Genetics,2000, Vol.16, No.1, pg.44-47 Nucleic Acids Research,2001, Vol.29, No.1, pg.137-140Nucleic Acids Research,2001, Vol.29, No.1, pg.137-140

PARA MAIS INFORMAÇÕES...

Page 3: Introduction of RefSeq and LocusLink: resources at the NCBI Magno Inácio dos Santos.

Equipe/recursosEquipe/recursos

Os idealizadores destes projetos foram os Os idealizadores destes projetos foram os pesquizadores; Kim D. Pruitt, Donna R. Maglott, pesquizadores; Kim D. Pruitt, Donna R. Maglott, Kenneth S. Katz e Hugues Sicote com recursos Kenneth S. Katz e Hugues Sicote com recursos para construção e manutenção dos seguintes para construção e manutenção dos seguintes

grupos:grupos:

– Human Gene Nomenclature CommitteeHuman Gene Nomenclature Committee– Online Mendelian Inheritance in ManOnline Mendelian Inheritance in Man– National Center for Biotechnology InformationNational Center for Biotechnology Information– contribuições individuais e institucionaiscontribuições individuais e institucionais

Page 4: Introduction of RefSeq and LocusLink: resources at the NCBI Magno Inácio dos Santos.

ObjetivosObjetivos

Encontrar a sequência de um gene;Encontrar a sequência de um gene; determinar o que se sabe sobre um gene ou determinar o que se sabe sobre um gene ou

proteína;proteína; estabelecer uma forma comum de referência para estabelecer uma forma comum de referência para

comparação de várias sequências e polimorfismos;comparação de várias sequências e polimorfismos; selecionar um número representativo de selecionar um número representativo de

sequências para estudos de expressão em larga sequências para estudos de expressão em larga escala.escala.

Page 5: Introduction of RefSeq and LocusLink: resources at the NCBI Magno Inácio dos Santos.

Uso das ferramentasUso das ferramentas

LocusLinkLocusLink organiza informações sobre genes organiza informações sobre genes gerando um banco de dados para serem gerando um banco de dados para serem acessadas informações de genes específicos;acessadas informações de genes específicos;

RefseqRefseq proporciona referências de modelos proporciona referências de modelos sequenciais de genomas, transcrições e sequenciais de genomas, transcrições e proteínas;proteínas;

RefSeqRefSeq e e LocusLinkLocusLink proporcionam uma via proporcionam uma via direta para auxiliar a pesquisa em genes e direta para auxiliar a pesquisa em genes e linhagens de genes, variação, expressão linhagens de genes, variação, expressão gênica e apontamento genomico.gênica e apontamento genomico.

Page 6: Introduction of RefSeq and LocusLink: resources at the NCBI Magno Inácio dos Santos.

Análise do LocusLinkAnálise do LocusLink

O LocusLink mantém informações descritivas sobre O LocusLink mantém informações descritivas sobre um“loci” incluindo nomenclatura, identificador de bancos um“loci” incluindo nomenclatura, identificador de bancos de dados (locus ID), doenças associadas, posições no de dados (locus ID), doenças associadas, posições no mapa e acréscimo de sequências;mapa e acréscimo de sequências;

O LocusLink mantém ligações diretas para facilitar O LocusLink mantém ligações diretas para facilitar pesquisas na PubMed, OMIM, RefSeq, GenBank, UniGene pesquisas na PubMed, OMIM, RefSeq, GenBank, UniGene e dbSNP .e dbSNP .

A pesquisa no LocusLink pode ser feita através de termos A pesquisa no LocusLink pode ser feita através de termos (como uma proteína ou nome de doença), símbolos de (como uma proteína ou nome de doença), símbolos de genes, sequências de acesso, e ID’s de bancos de dados. genes, sequências de acesso, e ID’s de bancos de dados.

Http://www.ncbi.nlm.nih.gov/LocusLink.htmlHttp://www.ncbi.nlm.nih.gov/LocusLink.html

Como acessar...

Page 7: Introduction of RefSeq and LocusLink: resources at the NCBI Magno Inácio dos Santos.

Análise do RefseqAnálise do Refseq

O RefSeq transcreve registros de proteínas. O RefSeq transcreve registros de proteínas. Diferente dos registros do Genbank, o RefSeq pode ser Diferente dos registros do Genbank, o RefSeq pode ser

modificado depois de revisado por um Biólogo.modificado depois de revisado por um Biólogo. Uma sequência provisória é computada de um registro Uma sequência provisória é computada de um registro

nucleotídico que tem uma região de codificação nucleotídico que tem uma região de codificação completa (CDS). O registro RefSeq de uma proteína é a completa (CDS). O registro RefSeq de uma proteína é a tradução de um apontamento de CDS. tradução de um apontamento de CDS.

Http://www.ncbi.nlm.nih.gov/LocusLink/refseq.htmlHttp://www.ncbi.nlm.nih.gov/LocusLink/refseq.html

Como acessar...

Page 8: Introduction of RefSeq and LocusLink: resources at the NCBI Magno Inácio dos Santos.

RefSeqRefSeq Banco de sequências de referência Banco de sequências de referência

– redundância do GenBank retirada redundância do GenBank retirada

Inclui nº acesso Inclui nº acesso – mRNAs (Nucleotide) NM mRNAs (Nucleotide) NM – proteínas (Protein) NP proteínas (Protein) NP – cromossomos inteiros (Genome) NC cromossomos inteiros (Genome) NC

Três níveis de curadoria para sequências NM: Três níveis de curadoria para sequências NM: – predita, provisória e revisada predita, provisória e revisada

Além de entradas originadas de anotação do Além de entradas originadas de anotação do genomagenoma

Page 9: Introduction of RefSeq and LocusLink: resources at the NCBI Magno Inácio dos Santos.

Três classes de NMTrês classes de NM Predita: automática Predita: automática

– cDNA com ORF sem função descrita cDNA com ORF sem função descrita

Provisória: manual Provisória: manual – proteína com função conhecida ou inferida proteína com função conhecida ou inferida – o melhor representante do GenBank, mais anotado o melhor representante do GenBank, mais anotado

Revisada: manual Revisada: manual – compilação sobre o gene e seus transcritos compilação sobre o gene e seus transcritos – sequência, propriedades, nomenclatura, referências, sequência, propriedades, nomenclatura, referências,

retirada de vetor, adição de UTRs, domínios conservados, retirada de vetor, adição de UTRs, domínios conservados, descrição da função do gene, linksdescrição da função do gene, links

Page 10: Introduction of RefSeq and LocusLink: resources at the NCBI Magno Inácio dos Santos.

Escolha das NM Escolha das NM provisóriasprovisórias

Preferência para entrada GenBank com mais UTR;Preferência para entrada GenBank com mais UTR; Diferença com GenBank:Diferença com GenBank:

– Inicialmente nenhumaInicialmente nenhuma– Anotação da entrada RefSeq vai ficando mais detalhadaAnotação da entrada RefSeq vai ficando mais detalhada– Acrescenta dados de vários laboratórios e entradas Acrescenta dados de vários laboratórios e entradas

Seleção de um único representante;Seleção de um único representante;– redundância = somente isoformas de processamentoredundância = somente isoformas de processamento

Pseudogenes não geram RefSeq;Pseudogenes não geram RefSeq;– Aparecem no GenBankAparecem no GenBank

Page 11: Introduction of RefSeq and LocusLink: resources at the NCBI Magno Inácio dos Santos.

Anotação do genomaAnotação do genoma

Software indica presença de gene e proteínaSoftware indica presença de gene e proteína;;

Sem comprovação de expressãoSem comprovação de expressão::

AcessoAcesso– NT contigs genômicos construídos,NT contigs genômicos construídos,– XM mRNA modelado (sem evidência EST),XM mRNA modelado (sem evidência EST),– XP proteína modelada XP proteína modelada

Page 12: Introduction of RefSeq and LocusLink: resources at the NCBI Magno Inácio dos Santos.

Download de Download de sequênciassequências

Somente a entrada única do gene:Somente a entrada única do gene:Nome [Gene name] e srcd RefSeq [prop];Nome [Gene name] e srcd RefSeq [prop];

Isoformas de processamento:Isoformas de processamento:Nome [Gene Name] e srcd RefSeq [properties];Nome [Gene Name] e srcd RefSeq [properties];

Todas as provisórias (combinar com organismo):Todas as provisórias (combinar com organismo):Srcd RefSeq [prop] e provisional [all];Srcd RefSeq [prop] e provisional [all];

Todas as revisadas (combinar com organismo): :Todas as revisadas (combinar com organismo): :Srcd RefSeq [prop] e Biomol mRNA [Prop] NOT provisional Srcd RefSeq [prop] e Biomol mRNA [Prop] NOT provisional

[all].[all].

Page 13: Introduction of RefSeq and LocusLink: resources at the NCBI Magno Inácio dos Santos.

Aumento e manutençãoAumento e manutenção

As informações levantadas no As informações levantadas no LocusLink e RefSeq estão sendo LocusLink e RefSeq estão sendo continuamente revisadas e continuamente revisadas e aumentadas. O número de aumentadas. O número de registros RefSeq triplicou, e o registros RefSeq triplicou, e o LocusLink expandiu cerca de cinco LocusLink expandiu cerca de cinco vezes num período de um ano.vezes num período de um ano.

Page 14: Introduction of RefSeq and LocusLink: resources at the NCBI Magno Inácio dos Santos.

Status atualStatus atual

Registros RefSeq novos e atualizados são Registros RefSeq novos e atualizados são avaliados continuamente pelo público.avaliados continuamente pelo público.

O site do LocusLink é atualizado O site do LocusLink é atualizado semanalmente.semanalmente.

Page 15: Introduction of RefSeq and LocusLink: resources at the NCBI Magno Inácio dos Santos.

URLs do NCBIURLs do NCBI