Banche Dati - di. dati-040216.pdf · PDF fileBanche Dati Modification Date: indica la...

Click here to load reader

  • date post

    15-Feb-2019
  • Category

    Documents

  • view

    212
  • download

    0

Embed Size (px)

Transcript of Banche Dati - di. dati-040216.pdf · PDF fileBanche Dati Modification Date: indica la...

Banche Dati Docente: Dr. Antinisca DI MARCO Email: [email protected]

mailto:[email protected]

Banche Dati

La biologia molecolare produce una grande mole di dati che pu essere memorizzata in database general-purpose o specialized (es. immunological):

general-purpose o primarie:

entries (o voci) di sequenze biologiche:

sequenza;

una breve descrizione;

lorganismo da cui proviene;

una lista di funzionalit strutturali e/o funzionali;

letteratura di riferimento;

Banche Dati

La biologia molecolare produce una grande mole di dati che pu essere memorizzata in database general-purpose o specialized (es. immunological):

specialized:

entries (o voci) di sequenze biologiche:

sequenza;

una breve descrizione;

lorganismo da cui proviene;

una lista di funzionalit strutturali e/o funzionali;

letteratura di riferimento;

annotazioni specifiche (expert).

Banche Dati

EMBL: European Molecular Biology Laboratory http://www.embl.org/

L'European Molecular Biology Laboratory un istituto di ricerca di biologia molecolare, sostenuto da 20 paesi europei e dall'Australia come stato membro associato. L'EMBL stato creato nel 1974 ed un'organizzazione intergovernativa di ricerca finanziata con denaro pubblico dai suoi stati membri. In EMBL la ricerca viene svolta da circa 85 gruppi indipendenti che coprono i vari campi della biologia molecolare.

Il Laboratorio attivo in cinque siti: il laboratorio principale a Heidelberg, e le sedi di Hinxton (l'European Bioinformatics Institute, EBI) presso Cambridge, Grenoble, Amburgo e Monterotondo vicino Roma. (Wikipedia)

http://www.embl.org/http://www.embl.org/http://it.wikipedia.org/wiki/European_Bioinformatics_Institutehttp://it.wikipedia.org/wiki/European_Bioinformatics_Institutehttp://it.wikipedia.org/wiki/European_Bioinformatics_Institutehttp://it.wikipedia.org/wiki/European_Bioinformatics_Institutehttp://it.wikipedia.org/wiki/European_Bioinformatics_Institutehttp://it.wikipedia.org/wiki/Cambridgehttp://it.wikipedia.org/wiki/Grenoblehttp://it.wikipedia.org/wiki/Amburgohttp://it.wikipedia.org/wiki/Monterotondo

Banche Dati

DDBJ: DNA Data Bank of Japan http://www.ddbj.nig.ac.jp/

La DNA Data Bank of Japan (DDBJ) un database biologico che raccoglie sequenze di DNA. Si trova presso l'Istituto Nazionale di Genetica (NIG) nella prefettura di Shizuoka, in Giappone. E anche un membro della International Nucleotide Sequence Database Collaboration or INSDC. Scambia i propri dati con EMBL e con GenBank presso il National Center for Biotechnology Information su base giornaliera. In questo modo le tre banche dati contengono gli stessi dati in qualsiasi momento.

http://www.ddbj.nig.ac.jp/http://www.ddbj.nig.ac.jp/

Banche Dati

I pi importanti database pubblici includono sequenze nucleotidiche e/o proteiche:

http://www.ncbi.nlm.nih.gov/protein

http://www.ncbi.nlm.nih.gov/proteinhttp://www.ncbi.nlm.nih.gov/protein

Banche Dati

NCBI: National Center for Biotechnology Information - http://www.ncbi.nlm.nih.gov/

Il National Center for Biotechnology Information (NCBI), Centro Nazionale per le Informazioni di Biologia Molecolare, una parte della National Library of Medicine (Biblioteca nazionale americana di medicina), che dipende a sua volta dall'Istituto per la salute americano. (Wikipedia)

http://www.ncbi.nlm.nih.gov/genbankhttp://www.ncbi.nlm.nih.gov/http://www.ncbi.nlm.nih.gov/http://it.wikipedia.org/wiki/National_Library_of_Medicinehttp://it.wikipedia.org/wiki/National_Institutes_of_Health

Banche Dati

UniProt: Universal Protein Resource - http://www.ebi.ac.uk/uniprot/index.html

UniProt (Universal Protein) il pi grande database bioinformatico per le sequenze proteiche di tutti gli organismi viventi e dei virus.

http://www.ebi.ac.uk/uniprot/index.htmlhttp://www.ebi.ac.uk/uniprot/index.html

Banche Dati

SWISS-PROT e PIR sono database di proteine che sono annotate manualmente. Il loro contenuto di alta qualit rispetto a GenPept e TrEMBL, ma contengono meno entries rispetto ad essi.

Banche Dati

GenPept e TrEMBL sono database di proteine derivate dalla traduzione di sequenze codificanti provenienti dai tre principali database di nucleotidi

Banche Dati

PDB - http://www.rcsb.org/pdb/home/home.do un database di strutture molecolari 3D.

http://www.rcsb.org/pdb/home/home.dohttp://www.rcsb.org/pdb/home/home.dohttp://www.rcsb.org/pdb/home/home.dohttp://www.rcsb.org/pdb/home/home.dohttp://www.rcsb.org/pdb/home/home.dohttp://www.rcsb.org/pdb/home/home.dohttp://www.rcsb.org/pdb/home/home.dohttp://www.rcsb.org/pdb/home/home.dohttp://www.rcsb.org/pdb/home/home.do

Banche Dati

PROSITE - http://prosite.expasy.org/ contiene pattern (motif) biologici significativi per determinare le funzioni delle proteine.

http://prosite.expasy.org/http://prosite.expasy.org/http://prosite.expasy.org/http://prosite.expasy.org/http://prosite.expasy.org/http://prosite.expasy.org/http://prosite.expasy.org/http://prosite.expasy.org/

Banche Dati

KEGG - http://www.genome.jp/kegg/ definisce un repository contenente reti di interazione molecolare, composti chimici e reazioni rilevanti per i processi cellulari, pi ovviamente dati genomici.

http://www.genome.jp/kegg/http://www.genome.jp/kegg/http://www.genome.jp/kegg/http://www.genome.jp/kegg/http://www.genome.jp/kegg/http://www.genome.jp/kegg/http://www.genome.jp/kegg/http://www.genome.jp/kegg/

Banche Dati

Pfam - http://pfam.sanger.ac.uk/ una raccolta di sequenze amminoacidiche (proteine) e di profili generati con Hidden Markov Model (HMM) che descrivono quasi tutte le famiglie e i domini proteici conosciuti.

http://pfam.sanger.ac.uk/http://pfam.sanger.ac.uk/http://pfam.sanger.ac.uk/http://pfam.sanger.ac.uk/http://pfam.sanger.ac.uk/http://pfam.sanger.ac.uk/http://pfam.sanger.ac.uk/http://pfam.sanger.ac.uk/http://pfam.sanger.ac.uk/http://pfam.sanger.ac.uk/

Banche Dati

Esplorando NCBI: Il National Center for Biotechnology Information (NCBI) curato National Library of Medicine and National Institutes of Health uno dei pi importanti repository e risorsa per dati biologici: Forniscono una rete di database di dati genetici, medici, informazioni biochimiche sempre crescente Interi genomi provenienti da virus, uomo, etc sono compilati ed organizzati e cross referenziati allinterno di questa rete Ma necessario sapere: a) che cosa stai cercando, e b) quello che stai guardando affinch si possa ottenere informazioni utili

https://www.nlm.nih.govhttps://www.nlm.nih.gov

Banche Dati

Esplorando NCBI: Il National Center for Biotechnology Information (NCBI) curato National Library of Medicine and National Institutes of Health uno dei pi importanti repository e risorsa per dati biologici: Forniscono una rete di database di dati genetici, medici, informazioni biochimiche sempre crescente Interi genomi provenienti da virus, uomo, etc sono compilati ed organizzati e cross referenziati allinterno di questa rete Ma necessario sapere: a) che cosa stai cercando, e b) quello che stai guardando affinch si possa ottenere informazioni utili

https://www.nlm.nih.govhttps://www.nlm.nih.gov

Banche Dati

Esplorando NCBI:

Apri un browser web ed entra nella Home page di NCBI: www.ncbi.nlm.nih.gov

http://www.ncbi.nlm.nih.gov

Banche Dati

Esplorando NCBI:

Apri un browser web ed entra nella Home page di NCBI: www.ncbi.nlm.nih.gov

http://www.ncbi.nlm.nih.gov

Banche Dati

Esplorando NCBI:

Apri un browser web ed entra nella Home page di NCBI: www.ncbi.nlm.nih.gov http://www.ncbi.nlm.nih.gov/About/ - About the NCBI

Il primo portale per accedere ai dati in NCBI chiamato GQuery:

http://www.ncbi.nlm.nih.govhttp://www.ncbi.nlm.nih.gov/About/http://www.ncbi.nlm.nih.gov/About/

Banche Dati

Esplorando NCBI:

Apri un browser web ed entra nella Home page di NCBI: www.ncbi.nlm.nih.gov http://www.ncbi.nlm.nih.gov/About/ - About the NCBI http://www.ncbi.nlm.nih.gov/books/NBK21101/ - NCBI Handbook

http://www.ncbi.nlm.nih.govhttp://www.ncbi.nlm.nih.gov/About/http://www.ncbi.nlm.nih.gov/About/http://www.ncbi.nlm.nih.gov/books/NBK21101/http://www.ncbi.nlm.nih.gov/books/NBK21101/http://www.ncbi.nlm.nih.gov/books/NBK21101/

Banche Dati

Esplorando NCBI:

Il primo portale per accedere ai dati in NCBI chiamato GQuery:

Banche Dati

Esplorando NCBI:

Il primo portale per accedere ai dati in NCBI chiamato GQuery:

Banche Dati

Esplorando NCBI:

Il primo portale per accedere ai dati in NCBI chiamato GQuery:

Banche Dati

Esplorando NCBI:

Il primo portale per accedere ai dati in NCBI chiamato GQuery:

..proviamo ad essere un p meno generici: bacteria

Banche Dati

Esplorando NCBI:

Il primo portale per accedere ai dati in NCBI chiamato GQuery:

..proviamo ad essere un p meno generici: bacteria

Solitamente, quando viene effettuata una ricerca su questi database, abbiamo: a disposizione una regione di DNA o proteina (o la funzione

di una proteina)

Banche Dati

Esempio:

Useremo un gene proveniente dalla Arabidopsis thaliana, che produce una proteina che rappresenta una componente strutturale del ribosoma.

LArabidopsis thaliana, una pianta floreale molto diffusa nel mondo ed pa