Introduction of RefSeq and LocusLink: resources at the NCBI Magno Inácio dos Santos.
Transcript of Introduction of RefSeq and LocusLink: resources at the NCBI Magno Inácio dos Santos.
Introduction of RefSeq and Introduction of RefSeq and LocusLink: resources at LocusLink: resources at
the NCBIthe NCBI
Magno Inácio dos SantosMagno Inácio dos Santos
ArtigosArtigos
Introducing refSeq and LocusLink: Introducing refSeq and LocusLink: curated human genome resources at curated human genome resources at the NCBIthe NCBI
RefSeq and LocusLink: NCBI gene-RefSeq and LocusLink: NCBI gene-centered resourcescentered resources
Trends in Genetics,2000, Vol.16, No.1, pg.44-47Trends in Genetics,2000, Vol.16, No.1, pg.44-47 Nucleic Acids Research,2001, Vol.29, No.1, pg.137-140Nucleic Acids Research,2001, Vol.29, No.1, pg.137-140
PARA MAIS INFORMAÇÕES...
Equipe/recursosEquipe/recursos
Os idealizadores destes projetos foram os Os idealizadores destes projetos foram os pesquizadores; Kim D. Pruitt, Donna R. Maglott, pesquizadores; Kim D. Pruitt, Donna R. Maglott, Kenneth S. Katz e Hugues Sicote com recursos Kenneth S. Katz e Hugues Sicote com recursos para construção e manutenção dos seguintes para construção e manutenção dos seguintes
grupos:grupos:
– Human Gene Nomenclature CommitteeHuman Gene Nomenclature Committee– Online Mendelian Inheritance in ManOnline Mendelian Inheritance in Man– National Center for Biotechnology InformationNational Center for Biotechnology Information– contribuições individuais e institucionaiscontribuições individuais e institucionais
ObjetivosObjetivos
Encontrar a sequência de um gene;Encontrar a sequência de um gene; determinar o que se sabe sobre um gene ou determinar o que se sabe sobre um gene ou
proteína;proteína; estabelecer uma forma comum de referência para estabelecer uma forma comum de referência para
comparação de várias sequências e polimorfismos;comparação de várias sequências e polimorfismos; selecionar um número representativo de selecionar um número representativo de
sequências para estudos de expressão em larga sequências para estudos de expressão em larga escala.escala.
Uso das ferramentasUso das ferramentas
LocusLinkLocusLink organiza informações sobre genes organiza informações sobre genes gerando um banco de dados para serem gerando um banco de dados para serem acessadas informações de genes específicos;acessadas informações de genes específicos;
RefseqRefseq proporciona referências de modelos proporciona referências de modelos sequenciais de genomas, transcrições e sequenciais de genomas, transcrições e proteínas;proteínas;
RefSeqRefSeq e e LocusLinkLocusLink proporcionam uma via proporcionam uma via direta para auxiliar a pesquisa em genes e direta para auxiliar a pesquisa em genes e linhagens de genes, variação, expressão linhagens de genes, variação, expressão gênica e apontamento genomico.gênica e apontamento genomico.
Análise do LocusLinkAnálise do LocusLink
O LocusLink mantém informações descritivas sobre O LocusLink mantém informações descritivas sobre um“loci” incluindo nomenclatura, identificador de bancos um“loci” incluindo nomenclatura, identificador de bancos de dados (locus ID), doenças associadas, posições no de dados (locus ID), doenças associadas, posições no mapa e acréscimo de sequências;mapa e acréscimo de sequências;
O LocusLink mantém ligações diretas para facilitar O LocusLink mantém ligações diretas para facilitar pesquisas na PubMed, OMIM, RefSeq, GenBank, UniGene pesquisas na PubMed, OMIM, RefSeq, GenBank, UniGene e dbSNP .e dbSNP .
A pesquisa no LocusLink pode ser feita através de termos A pesquisa no LocusLink pode ser feita através de termos (como uma proteína ou nome de doença), símbolos de (como uma proteína ou nome de doença), símbolos de genes, sequências de acesso, e ID’s de bancos de dados. genes, sequências de acesso, e ID’s de bancos de dados.
Http://www.ncbi.nlm.nih.gov/LocusLink.htmlHttp://www.ncbi.nlm.nih.gov/LocusLink.html
Como acessar...
Análise do RefseqAnálise do Refseq
O RefSeq transcreve registros de proteínas. O RefSeq transcreve registros de proteínas. Diferente dos registros do Genbank, o RefSeq pode ser Diferente dos registros do Genbank, o RefSeq pode ser
modificado depois de revisado por um Biólogo.modificado depois de revisado por um Biólogo. Uma sequência provisória é computada de um registro Uma sequência provisória é computada de um registro
nucleotídico que tem uma região de codificação nucleotídico que tem uma região de codificação completa (CDS). O registro RefSeq de uma proteína é a completa (CDS). O registro RefSeq de uma proteína é a tradução de um apontamento de CDS. tradução de um apontamento de CDS.
Http://www.ncbi.nlm.nih.gov/LocusLink/refseq.htmlHttp://www.ncbi.nlm.nih.gov/LocusLink/refseq.html
Como acessar...
RefSeqRefSeq Banco de sequências de referência Banco de sequências de referência
– redundância do GenBank retirada redundância do GenBank retirada
Inclui nº acesso Inclui nº acesso – mRNAs (Nucleotide) NM mRNAs (Nucleotide) NM – proteínas (Protein) NP proteínas (Protein) NP – cromossomos inteiros (Genome) NC cromossomos inteiros (Genome) NC
Três níveis de curadoria para sequências NM: Três níveis de curadoria para sequências NM: – predita, provisória e revisada predita, provisória e revisada
Além de entradas originadas de anotação do Além de entradas originadas de anotação do genomagenoma
Três classes de NMTrês classes de NM Predita: automática Predita: automática
– cDNA com ORF sem função descrita cDNA com ORF sem função descrita
Provisória: manual Provisória: manual – proteína com função conhecida ou inferida proteína com função conhecida ou inferida – o melhor representante do GenBank, mais anotado o melhor representante do GenBank, mais anotado
Revisada: manual Revisada: manual – compilação sobre o gene e seus transcritos compilação sobre o gene e seus transcritos – sequência, propriedades, nomenclatura, referências, sequência, propriedades, nomenclatura, referências,
retirada de vetor, adição de UTRs, domínios conservados, retirada de vetor, adição de UTRs, domínios conservados, descrição da função do gene, linksdescrição da função do gene, links
Escolha das NM Escolha das NM provisóriasprovisórias
Preferência para entrada GenBank com mais UTR;Preferência para entrada GenBank com mais UTR; Diferença com GenBank:Diferença com GenBank:
– Inicialmente nenhumaInicialmente nenhuma– Anotação da entrada RefSeq vai ficando mais detalhadaAnotação da entrada RefSeq vai ficando mais detalhada– Acrescenta dados de vários laboratórios e entradas Acrescenta dados de vários laboratórios e entradas
Seleção de um único representante;Seleção de um único representante;– redundância = somente isoformas de processamentoredundância = somente isoformas de processamento
Pseudogenes não geram RefSeq;Pseudogenes não geram RefSeq;– Aparecem no GenBankAparecem no GenBank
Anotação do genomaAnotação do genoma
Software indica presença de gene e proteínaSoftware indica presença de gene e proteína;;
Sem comprovação de expressãoSem comprovação de expressão::
AcessoAcesso– NT contigs genômicos construídos,NT contigs genômicos construídos,– XM mRNA modelado (sem evidência EST),XM mRNA modelado (sem evidência EST),– XP proteína modelada XP proteína modelada
Download de Download de sequênciassequências
Somente a entrada única do gene:Somente a entrada única do gene:Nome [Gene name] e srcd RefSeq [prop];Nome [Gene name] e srcd RefSeq [prop];
Isoformas de processamento:Isoformas de processamento:Nome [Gene Name] e srcd RefSeq [properties];Nome [Gene Name] e srcd RefSeq [properties];
Todas as provisórias (combinar com organismo):Todas as provisórias (combinar com organismo):Srcd RefSeq [prop] e provisional [all];Srcd RefSeq [prop] e provisional [all];
Todas as revisadas (combinar com organismo): :Todas as revisadas (combinar com organismo): :Srcd RefSeq [prop] e Biomol mRNA [Prop] NOT provisional Srcd RefSeq [prop] e Biomol mRNA [Prop] NOT provisional
[all].[all].
Aumento e manutençãoAumento e manutenção
As informações levantadas no As informações levantadas no LocusLink e RefSeq estão sendo LocusLink e RefSeq estão sendo continuamente revisadas e continuamente revisadas e aumentadas. O número de aumentadas. O número de registros RefSeq triplicou, e o registros RefSeq triplicou, e o LocusLink expandiu cerca de cinco LocusLink expandiu cerca de cinco vezes num período de um ano.vezes num período de um ano.
Status atualStatus atual
Registros RefSeq novos e atualizados são Registros RefSeq novos e atualizados são avaliados continuamente pelo público.avaliados continuamente pelo público.
O site do LocusLink é atualizado O site do LocusLink é atualizado semanalmente.semanalmente.
URLs do NCBIURLs do NCBI