Banche Dati - di. dati-040216.pdf · PDF fileBanche Dati Modification Date: indica la...
date post
15-Feb-2019Category
Documents
view
212download
0
Embed Size (px)
Transcript of Banche Dati - di. dati-040216.pdf · PDF fileBanche Dati Modification Date: indica la...
Banche Dati Docente: Dr. Antinisca DI MARCO Email: [email protected]
mailto:[email protected]
Banche Dati
La biologia molecolare produce una grande mole di dati che pu essere memorizzata in database general-purpose o specialized (es. immunological):
general-purpose o primarie:
entries (o voci) di sequenze biologiche:
sequenza;
una breve descrizione;
lorganismo da cui proviene;
una lista di funzionalit strutturali e/o funzionali;
letteratura di riferimento;
Banche Dati
La biologia molecolare produce una grande mole di dati che pu essere memorizzata in database general-purpose o specialized (es. immunological):
specialized:
entries (o voci) di sequenze biologiche:
sequenza;
una breve descrizione;
lorganismo da cui proviene;
una lista di funzionalit strutturali e/o funzionali;
letteratura di riferimento;
annotazioni specifiche (expert).
Banche Dati
EMBL: European Molecular Biology Laboratory http://www.embl.org/
L'European Molecular Biology Laboratory un istituto di ricerca di biologia molecolare, sostenuto da 20 paesi europei e dall'Australia come stato membro associato. L'EMBL stato creato nel 1974 ed un'organizzazione intergovernativa di ricerca finanziata con denaro pubblico dai suoi stati membri. In EMBL la ricerca viene svolta da circa 85 gruppi indipendenti che coprono i vari campi della biologia molecolare.
Il Laboratorio attivo in cinque siti: il laboratorio principale a Heidelberg, e le sedi di Hinxton (l'European Bioinformatics Institute, EBI) presso Cambridge, Grenoble, Amburgo e Monterotondo vicino Roma. (Wikipedia)
http://www.embl.org/http://www.embl.org/http://it.wikipedia.org/wiki/European_Bioinformatics_Institutehttp://it.wikipedia.org/wiki/European_Bioinformatics_Institutehttp://it.wikipedia.org/wiki/European_Bioinformatics_Institutehttp://it.wikipedia.org/wiki/European_Bioinformatics_Institutehttp://it.wikipedia.org/wiki/European_Bioinformatics_Institutehttp://it.wikipedia.org/wiki/Cambridgehttp://it.wikipedia.org/wiki/Grenoblehttp://it.wikipedia.org/wiki/Amburgohttp://it.wikipedia.org/wiki/Monterotondo
Banche Dati
DDBJ: DNA Data Bank of Japan http://www.ddbj.nig.ac.jp/
La DNA Data Bank of Japan (DDBJ) un database biologico che raccoglie sequenze di DNA. Si trova presso l'Istituto Nazionale di Genetica (NIG) nella prefettura di Shizuoka, in Giappone. E anche un membro della International Nucleotide Sequence Database Collaboration or INSDC. Scambia i propri dati con EMBL e con GenBank presso il National Center for Biotechnology Information su base giornaliera. In questo modo le tre banche dati contengono gli stessi dati in qualsiasi momento.
http://www.ddbj.nig.ac.jp/http://www.ddbj.nig.ac.jp/
Banche Dati
I pi importanti database pubblici includono sequenze nucleotidiche e/o proteiche:
http://www.ncbi.nlm.nih.gov/protein
http://www.ncbi.nlm.nih.gov/proteinhttp://www.ncbi.nlm.nih.gov/protein
Banche Dati
NCBI: National Center for Biotechnology Information - http://www.ncbi.nlm.nih.gov/
Il National Center for Biotechnology Information (NCBI), Centro Nazionale per le Informazioni di Biologia Molecolare, una parte della National Library of Medicine (Biblioteca nazionale americana di medicina), che dipende a sua volta dall'Istituto per la salute americano. (Wikipedia)
http://www.ncbi.nlm.nih.gov/genbankhttp://www.ncbi.nlm.nih.gov/http://www.ncbi.nlm.nih.gov/http://it.wikipedia.org/wiki/National_Library_of_Medicinehttp://it.wikipedia.org/wiki/National_Institutes_of_Health
Banche Dati
UniProt: Universal Protein Resource - http://www.ebi.ac.uk/uniprot/index.html
UniProt (Universal Protein) il pi grande database bioinformatico per le sequenze proteiche di tutti gli organismi viventi e dei virus.
http://www.ebi.ac.uk/uniprot/index.htmlhttp://www.ebi.ac.uk/uniprot/index.html
Banche Dati
SWISS-PROT e PIR sono database di proteine che sono annotate manualmente. Il loro contenuto di alta qualit rispetto a GenPept e TrEMBL, ma contengono meno entries rispetto ad essi.
Banche Dati
GenPept e TrEMBL sono database di proteine derivate dalla traduzione di sequenze codificanti provenienti dai tre principali database di nucleotidi
Banche Dati
PDB - http://www.rcsb.org/pdb/home/home.do un database di strutture molecolari 3D.
http://www.rcsb.org/pdb/home/home.dohttp://www.rcsb.org/pdb/home/home.dohttp://www.rcsb.org/pdb/home/home.dohttp://www.rcsb.org/pdb/home/home.dohttp://www.rcsb.org/pdb/home/home.dohttp://www.rcsb.org/pdb/home/home.dohttp://www.rcsb.org/pdb/home/home.dohttp://www.rcsb.org/pdb/home/home.dohttp://www.rcsb.org/pdb/home/home.do
Banche Dati
PROSITE - http://prosite.expasy.org/ contiene pattern (motif) biologici significativi per determinare le funzioni delle proteine.
http://prosite.expasy.org/http://prosite.expasy.org/http://prosite.expasy.org/http://prosite.expasy.org/http://prosite.expasy.org/http://prosite.expasy.org/http://prosite.expasy.org/http://prosite.expasy.org/
Banche Dati
KEGG - http://www.genome.jp/kegg/ definisce un repository contenente reti di interazione molecolare, composti chimici e reazioni rilevanti per i processi cellulari, pi ovviamente dati genomici.
http://www.genome.jp/kegg/http://www.genome.jp/kegg/http://www.genome.jp/kegg/http://www.genome.jp/kegg/http://www.genome.jp/kegg/http://www.genome.jp/kegg/http://www.genome.jp/kegg/http://www.genome.jp/kegg/
Banche Dati
Pfam - http://pfam.sanger.ac.uk/ una raccolta di sequenze amminoacidiche (proteine) e di profili generati con Hidden Markov Model (HMM) che descrivono quasi tutte le famiglie e i domini proteici conosciuti.
http://pfam.sanger.ac.uk/http://pfam.sanger.ac.uk/http://pfam.sanger.ac.uk/http://pfam.sanger.ac.uk/http://pfam.sanger.ac.uk/http://pfam.sanger.ac.uk/http://pfam.sanger.ac.uk/http://pfam.sanger.ac.uk/http://pfam.sanger.ac.uk/http://pfam.sanger.ac.uk/
Banche Dati
Esplorando NCBI: Il National Center for Biotechnology Information (NCBI) curato National Library of Medicine and National Institutes of Health uno dei pi importanti repository e risorsa per dati biologici: Forniscono una rete di database di dati genetici, medici, informazioni biochimiche sempre crescente Interi genomi provenienti da virus, uomo, etc sono compilati ed organizzati e cross referenziati allinterno di questa rete Ma necessario sapere: a) che cosa stai cercando, e b) quello che stai guardando affinch si possa ottenere informazioni utili
https://www.nlm.nih.govhttps://www.nlm.nih.gov
Banche Dati
Esplorando NCBI: Il National Center for Biotechnology Information (NCBI) curato National Library of Medicine and National Institutes of Health uno dei pi importanti repository e risorsa per dati biologici: Forniscono una rete di database di dati genetici, medici, informazioni biochimiche sempre crescente Interi genomi provenienti da virus, uomo, etc sono compilati ed organizzati e cross referenziati allinterno di questa rete Ma necessario sapere: a) che cosa stai cercando, e b) quello che stai guardando affinch si possa ottenere informazioni utili
https://www.nlm.nih.govhttps://www.nlm.nih.gov
Banche Dati
Esplorando NCBI:
Apri un browser web ed entra nella Home page di NCBI: www.ncbi.nlm.nih.gov
http://www.ncbi.nlm.nih.gov
Banche Dati
Esplorando NCBI:
Apri un browser web ed entra nella Home page di NCBI: www.ncbi.nlm.nih.gov
http://www.ncbi.nlm.nih.gov
Banche Dati
Esplorando NCBI:
Apri un browser web ed entra nella Home page di NCBI: www.ncbi.nlm.nih.gov http://www.ncbi.nlm.nih.gov/About/ - About the NCBI
Il primo portale per accedere ai dati in NCBI chiamato GQuery:
http://www.ncbi.nlm.nih.govhttp://www.ncbi.nlm.nih.gov/About/http://www.ncbi.nlm.nih.gov/About/
Banche Dati
Esplorando NCBI:
Apri un browser web ed entra nella Home page di NCBI: www.ncbi.nlm.nih.gov http://www.ncbi.nlm.nih.gov/About/ - About the NCBI http://www.ncbi.nlm.nih.gov/books/NBK21101/ - NCBI Handbook
http://www.ncbi.nlm.nih.govhttp://www.ncbi.nlm.nih.gov/About/http://www.ncbi.nlm.nih.gov/About/http://www.ncbi.nlm.nih.gov/books/NBK21101/http://www.ncbi.nlm.nih.gov/books/NBK21101/http://www.ncbi.nlm.nih.gov/books/NBK21101/
Banche Dati
Esplorando NCBI:
Il primo portale per accedere ai dati in NCBI chiamato GQuery:
Banche Dati
Esplorando NCBI:
Il primo portale per accedere ai dati in NCBI chiamato GQuery:
Banche Dati
Esplorando NCBI:
Il primo portale per accedere ai dati in NCBI chiamato GQuery:
Banche Dati
Esplorando NCBI:
Il primo portale per accedere ai dati in NCBI chiamato GQuery:
..proviamo ad essere un p meno generici: bacteria
Banche Dati
Esplorando NCBI:
Il primo portale per accedere ai dati in NCBI chiamato GQuery:
..proviamo ad essere un p meno generici: bacteria
Solitamente, quando viene effettuata una ricerca su questi database, abbiamo: a disposizione una regione di DNA o proteina (o la funzione
di una proteina)
Banche Dati
Esempio:
Useremo un gene proveniente dalla Arabidopsis thaliana, che produce una proteina che rappresenta una componente strutturale del ribosoma.
LArabidopsis thaliana, una pianta floreale molto diffusa nel mondo ed pa