FESR Trinacria Grid Virtual Laboratory ADAT (Archivi Digitali Antico Testo) Salvatore Scifo TRIGRID...

12
FESR www.trigrid.it Trinacria Grid Virtual Laboratory ADAT (Archivi Digitali Antico Testo) Salvatore Scifo TRIGRID Second TriGrid Checkpoint Meeting Catania, 30.06.2006

Transcript of FESR Trinacria Grid Virtual Laboratory ADAT (Archivi Digitali Antico Testo) Salvatore Scifo TRIGRID...

Page 1: FESR  Trinacria Grid Virtual Laboratory ADAT (Archivi Digitali Antico Testo) Salvatore Scifo TRIGRID Second TriGrid Checkpoint Meeting Catania,

FESR

www.trigrid.it

Trinacria Grid Virtual Laboratory

ADAT (Archivi Digitali Antico Testo)

Salvatore Scifo

TRIGRID

Second TriGrid Checkpoint Meeting

Catania, 30.06.2006

Page 2: FESR  Trinacria Grid Virtual Laboratory ADAT (Archivi Digitali Antico Testo) Salvatore Scifo TRIGRID Second TriGrid Checkpoint Meeting Catania,

Catania, Trigrid, 30.06.2006

Supporter e Partner responsabili

• I.N.F.N. di Catania:– Salvatore Scifo ([email protected])

Supporter

Partner responsabili

• IR&T Engineering s.r.l.– Vincenzo Milazzo ([email protected])

Page 3: FESR  Trinacria Grid Virtual Laboratory ADAT (Archivi Digitali Antico Testo) Salvatore Scifo TRIGRID Second TriGrid Checkpoint Meeting Catania,

Catania, Trigrid, 30.06.2006

L’applicazione

• ADAT (Archivi Digitali Antico Testo)

– Rappresenta un Modello di Processo costituito da: Metodologie Tecnologie Procedure Hardware e Software

– Tale modello è orientato alla conservazione del testo reale in se ed alla divulgazione del suo valore intrinseco anche tramite la sua rappresentazione virtuale.

– Ci focalizzeremo su due aspetti del processo: Catalogazione e Archiviazione su storage GRID; Restauro Digitale del Testo.

Restauro/Conservazione

Acquisizione /Restauro Digitale

Catalogazione/Archiviazione

Fruizione in rete

Page 4: FESR  Trinacria Grid Virtual Laboratory ADAT (Archivi Digitali Antico Testo) Salvatore Scifo TRIGRID Second TriGrid Checkpoint Meeting Catania,

Catania, Trigrid, 30.06.2006

• Capacità di contenere e gestire enormi quantità di dati (ordine di Tera Byte)

• Distribuzione geografica dello storage

• Accessibilità via rete (modello web oriented) delle funzionalità (amministrative, operative, consultative)

• Protezione mediante un meccanismo di sicurezza centralizzato che identifichi chi può accedere alle risorse e con quali diritti, in base alla Organizzazione Virtuale di appartenenza

• Separazione aspetto gestionale e amministrativo dell’archivio digitale dalle problematiche di manutenzione dell’infrastruttura di rete e dello storage system

La problematica scientifica

Page 5: FESR  Trinacria Grid Virtual Laboratory ADAT (Archivi Digitali Antico Testo) Salvatore Scifo TRIGRID Second TriGrid Checkpoint Meeting Catania,

Catania, Trigrid, 30.06.2006

Analisi del problema

• Analisi, progettazione e realizzazione di una piattaforma SW per l’interfacciamento con i servizi del DMS (Metadata Service e File Access Service)

– La piattaforma software deve permettere di implementare le funzionalità di base di un archivio digitale: Upload di file sullo SE Download di file dallo SE Cancellazione di file dallo SE Gestione Catalogo dei File Gestione delle Repliche Gestione dei Metadati descrittivi, acquisizione, catalogazione,

indicizzazione Gestione della coerenza tra le entry del catalogo (file) e i metadati

ad essi associati Browsing del catalogo dei file Ricerca dei file per metadati

Page 6: FESR  Trinacria Grid Virtual Laboratory ADAT (Archivi Digitali Antico Testo) Salvatore Scifo TRIGRID Second TriGrid Checkpoint Meeting Catania,

Catania, Trigrid, 30.06.2006

Architettura a livelli del sistema

• L’idea base è realizzare una architettura distribuita e aperta, per garantire l’interoperabilità con i servizi di gestione dei dati e metadati della infrastruttura GRID (DMS – Data Management Services).

GRID FARM(Redundancy, High Availability, Data Backup&Recovery, High Storage Capability, Net Access Security)

GRID Metadata Service GRID File Service

Grid Access Framework

Archive Web Application

Page 7: FESR  Trinacria Grid Virtual Laboratory ADAT (Archivi Digitali Antico Testo) Salvatore Scifo TRIGRID Second TriGrid Checkpoint Meeting Catania,

Catania, Trigrid, 30.06.2006

Deployment Plan

GRID Storage

AMGA Server

VOMS

Application Server

Metadata Service

Authentication Service

Storage Service LCG File Catalog

File Catalog Service

InternetGRID

Clients

Page 8: FESR  Trinacria Grid Virtual Laboratory ADAT (Archivi Digitali Antico Testo) Salvatore Scifo TRIGRID Second TriGrid Checkpoint Meeting Catania,

Catania, Trigrid, 30.06.2006

Architettura Software

LFCFile Catalog

AMGAMetadata catalog

GFAL API LFC API AMGA API

GFAL API LFC API AMGA API

Grid DMS

GRID Access Framework Metadata Manager

Archive Application Search Engine

Digital Archive

SRM

Grid Access Framework

Storage Element

VO

MS

AP

I

VOMS/PROXY

Grid Security

VO

MS

AP

I

Page 9: FESR  Trinacria Grid Virtual Laboratory ADAT (Archivi Digitali Antico Testo) Salvatore Scifo TRIGRID Second TriGrid Checkpoint Meeting Catania,

Catania, Trigrid, 30.06.2006

Scheda Tecnica Porting

• Storage– Storage : 50 GB per libro (circa 1000 immagini di elevata qualità)

• Configurazione Worker Node:– nessuna

• Servizi gLite 3.0– GFAL– LFC– AMGA

• Interazione tra l’applicazione e l’utente– Applicazione interattiva

• Controllo d’accesso:– Numero utenti: 5– Numero gruppi per VO: 1– Politica di accesso: gli utenti del gruppo hanno tutti gli stessi permessi,

accesso all’applicazione e accesso ai file– Crittografia dati: nessuna

Page 10: FESR  Trinacria Grid Virtual Laboratory ADAT (Archivi Digitali Antico Testo) Salvatore Scifo TRIGRID Second TriGrid Checkpoint Meeting Catania,

Catania, Trigrid, 30.06.2006

Stato attuale del progetto

• Testati casi d’uso AMGA (server remoto)– Browsing directories

– Inserimento entry

– Cancellazione entry

• Testati casi d’uso GFAL (sulla UI)– Upload file sullo SE

– Download file dallo SE

– Rimozione file dallo SE

• Testati casi d’uso LFC (sulla UI)– Browsing catalogo

– Creazione entry nel catalogo

– Consultazione entry

Page 11: FESR  Trinacria Grid Virtual Laboratory ADAT (Archivi Digitali Antico Testo) Salvatore Scifo TRIGRID Second TriGrid Checkpoint Meeting Catania,

Catania, Trigrid, 30.06.2006

Attività Future

• Analisi e progettazione architettura archivio

• Analisi e progettazione Grid Access Framework

• Casi d’uso AMGA (server remoto)– Creazione metadata schema

– Inserimento metadati

– Ricerca sui metadati

• Casi d’uso LFC (sulla UI)– Modifica entry

– Creazione repliche

– Consultazione repliche

– Rimozione repliche

Page 12: FESR  Trinacria Grid Virtual Laboratory ADAT (Archivi Digitali Antico Testo) Salvatore Scifo TRIGRID Second TriGrid Checkpoint Meeting Catania,

Catania, Trigrid, 30.06.2006

Problematiche Porting

• Integrazione VOMS e/o Proxy Server

• Sviluppo web service (wrapper) per GFAL API (accesso da remoto)

• Svilupp web service per LFG Utils API (accesso da remoto)