Data Sharing, DataGov e Open Data

81
Società italiana di statistica Scuola SIS Web e Statistica Data Sharing, Data Gov e Open Data Vincenzo Patruno Pisa, Santa Croce in Fossabanda, 5 9 settembre 2011 Dipartimento di economia aziendale Dipartimento di statistica applicata all’economia Facoltà di Economia, Università di Pisa

Transcript of Data Sharing, DataGov e Open Data

Page 1: Data Sharing, DataGov e Open Data

Società italiana di statistica

Scuola SIS

Web e Statistica

Data Sharing, Data Gov e Open DataVincenzo Patruno

Pisa, Santa Croce in Fossabanda,

5 – 9 settembre 2011

Dipartimento di economia aziendale

Dipartimento di statistica applicata all’economiaFacoltà di Economia, Università di Pisa

Page 2: Data Sharing, DataGov e Open Data

Il punto di partenzaS

cu

ola

SIS

“W

eb

e S

tati

sti

ca”

“Lavoreremo insieme per accrescere la fiducia del pubblico e per

creare un sistema basato sulla trasparenza, la partecipazione e

la collaborazione. Questa apertura rafforzerà la nostra

democrazia e promuoverà l'efficienza e l'efficacia del nostro

governo”

Barak Obama

http://www.whitehouse.gov/the_press_office/TransparencyandOpenGovernment/

Page 3: Data Sharing, DataGov e Open Data

Il punto di partenzaS

cu

ola

SIS

“W

eb

e S

tati

sti

ca”

“Make a beautiful website, but first give us the unadulterated data,

we want the data. We want unadulterated data. OK, we have to

ask for raw data now”

Sir Tim Berners-Lee, inventor of the World Wide Web

Page 4: Data Sharing, DataGov e Open Data

Open Government

Si intende un modello di Governance a

livello centrale e locale basato sull'apertura

(partecipazione e collaborazione) e sulla

trasparenza nei confronti dei cittadini

Scu

ola

SIS

“W

eb

e S

tati

sti

ca”

Page 5: Data Sharing, DataGov e Open Data

Open Government

Apertura: “ridefinire le modalita' di approccio e di

relazione delle amministrazioni nei confronti del

cittadino” (attraverso la partecipazione e la

collaborazione).

Scu

ola

SIS

“W

eb

e S

tati

sti

ca”

Fonte: Come si fa Open Data? Istruzioni per l'uso per Enti e Amministrazioni Pubbliche –

Associazione italiana per l'Open Government - Maggioli Editore 2011

Page 6: Data Sharing, DataGov e Open Data

Open Government

Trasparenza: “consentire, stimolare e facilitare i

cittadini nelle attività di controllo continuo dei

processi decisionali all‟interno delle istituzioni, a tutti

i livelli amministrativi e attraverso l‟utilizzo delle

nuove tecnologie.”

Scu

ola

SIS

“W

eb

e S

tati

sti

ca”

Fonte: Come si fa Open Data? Istruzioni per l'uso per Enti e Amministrazioni Pubbliche –

Associazione italiana per l'Open Government - Maggioli Editore 2011

Page 7: Data Sharing, DataGov e Open Data

Open GovernmentS

cu

ola

SIS

“W

eb

e S

tati

sti

ca”

http://www.recovery.gov

http://www.usaspending.gov

Page 8: Data Sharing, DataGov e Open Data

Open GovernmentS

cu

ola

SIS

“W

eb

e S

tati

sti

ca”

Where Does My Money Go

http://www.wheredoesmymoneygo.org

http://www.openspending.org

by

Page 9: Data Sharing, DataGov e Open Data

Open GovernmentS

cu

ola

SIS

“W

eb

e S

tati

sti

ca”

http://opengovernmentdata.org/data/map/

Page 10: Data Sharing, DataGov e Open Data

E in Italia?S

cu

ola

SIS

“W

eb

e S

tati

sti

ca”

?

Page 12: Data Sharing, DataGov e Open Data

Gli HashtagS

cu

ola

SIS

“W

eb

e S

tati

sti

ca” #a4i

#opendata

#okf

#opengov

#opendataitaly

#24opendata

Page 13: Data Sharing, DataGov e Open Data

Open GovernmentS

cu

ola

SIS

“W

eb

e S

tati

sti

ca”

“[...] Rendere più trasparente il lavoro del governo

mettendo a disposizione in un unico sito web le

informazioni su economia, salute, ambiente e altri

argomenti, consentendo al pubblico di accedere ai

dati grezzi e di utilizzarli in nuovi modi innovativi”

Page 14: Data Sharing, DataGov e Open Data

Open GovernmentS

cu

ola

SIS

“W

eb

e S

tati

sti

ca” C’è la consapevolezza che l’Open

Government sia un elemento chiave per lo

sviluppo economico e sociale di un

Paese

Page 15: Data Sharing, DataGov e Open Data

Open Data

Nel 2009 la Commissione UE ha stimato

che il mercato europeo per il riutilizzo delle

informazioni del settore pubblico sia di 27

miliardi di euro l’anno. Un’enorme quantità di

denaro di cui, nel 2011, ancora nessuno ha

realmente beneficiato.

Scu

ola

SIS

“W

eb

e S

tati

sti

ca”

Studio “MEPSIR – Measuring European Public Sector

Information Resources" (2006), HELM Group

of Companies with Zenc, per la Commissione europea.

Page 16: Data Sharing, DataGov e Open Data

Dati pubblici e Dati OpenS

cu

ola

SIS

“W

eb

e S

tati

sti

ca” I dati Open sono dati Pubblici riutilizzabili

http://opendatamanual.org/

Page 17: Data Sharing, DataGov e Open Data

Open DataS

cu

ola

SIS

“W

eb

e S

tati

sti

ca” L’intelligenza collettiva

Page 18: Data Sharing, DataGov e Open Data

Open DataS

cu

ola

SIS

“W

eb

e S

tati

sti

ca”

Data JournalismApps

Page 19: Data Sharing, DataGov e Open Data

Data JournalismS

cu

ola

SIS

“W

eb

e S

tati

sti

ca”

Page 20: Data Sharing, DataGov e Open Data

AppsS

cu

ola

SIS

“W

eb

e S

tati

sti

ca”

Applicazioni Web

Applicazioni standalone su desktop

Applicazioni standalone su dispositivi mobile

Page 21: Data Sharing, DataGov e Open Data

I Contest sugli Open DataS

cu

ola

SIS

“W

eb

e S

tati

sti

ca”

http://www.appsfordemocracy.org/

La prima edizione di Apps for Democracy ha fruttato 47

Apps (web, iPhone e Facebook) in 47 giorni per un

valore di $2,300,000 per la città a fronte di un costo di

$50,000

“Our mission with "Community Edition" is two fold: to engage the

populace of Washington, DC to ask for their input into the problems

and ideas they have that can be addressed with technology and then

to build the best community platform for submitting 311 service

requests to the city”

Page 22: Data Sharing, DataGov e Open Data

I Contest sugli Open DataS

cu

ola

SIS

“W

eb

e S

tati

sti

ca”

http://appsfordevelopment.challengepost.com/

Page 23: Data Sharing, DataGov e Open Data

I Contest sugli Open DataS

cu

ola

SIS

“W

eb

e S

tati

sti

ca”

http://opendatachallenge.org/

Page 24: Data Sharing, DataGov e Open Data

I Contest sugli Open DataS

cu

ola

SIS

“W

eb

e S

tati

sti

ca”

http://www.appsforitaly.org/

Page 25: Data Sharing, DataGov e Open Data

Open DataS

cu

ola

SIS

“W

eb

e S

tati

sti

ca”

L’illuminante talk di Sir Tim Berners-Lee:

The year open data went worldwide

http://www.ted.com/talks/tim_berners_lee_the_year_open_data_went_worldwide.html

Page 26: Data Sharing, DataGov e Open Data

Ma… come trovare i dati?S

cu

ola

SIS

“W

eb

e S

tati

sti

ca”

Come i dati vengono messi sulla Rete

Page 27: Data Sharing, DataGov e Open Data

Un passo indietroS

cu

ola

SIS

“W

eb

e S

tati

sti

ca”

Page 28: Data Sharing, DataGov e Open Data

Il diluvio di datiS

cu

ola

SIS

“W

eb

e S

tati

sti

ca”

Page 29: Data Sharing, DataGov e Open Data

Imprigionare i datiS

cu

ola

SIS

“W

eb

e S

tati

sti

ca”

I dati vengono di fatto imprigionati nei portali, nei

sistemi informativi e nei siti web dove vengono rilasciati

Page 30: Data Sharing, DataGov e Open Data

La caccia ai datiS

cu

ola

SIS

“W

eb

e S

tati

sti

ca”

Page 31: Data Sharing, DataGov e Open Data

I dati sul WebS

cu

ola

SIS

“W

eb

e S

tati

sti

ca”

Portali

Sistemi Informativi

DataGov

Open Data

Page 32: Data Sharing, DataGov e Open Data

Scu

ola

SIS

“W

eb

e S

tati

sti

ca”

=

La caccia ai dati

Page 33: Data Sharing, DataGov e Open Data

Le piattaforme di DataGovS

cu

ola

SIS

“W

eb

e S

tati

sti

ca”

http://data.octo.dc.gov/

Page 34: Data Sharing, DataGov e Open Data

Le piattaforme di DataGovS

cu

ola

SIS

“W

eb

e S

tati

sti

ca”

http://www.data.gov/ http://www.data.gov.uk/

Page 35: Data Sharing, DataGov e Open Data

Le piattaforme di DataGovS

cu

ola

SIS

“W

eb

e S

tati

sti

ca”

Page 36: Data Sharing, DataGov e Open Data

EU Call for TenderS

cu

ola

SIS

“W

eb

e S

tati

sti

ca”

Page 37: Data Sharing, DataGov e Open Data

OKF e CKANS

cu

ola

SIS

“W

eb

e S

tati

sti

ca”

Page 38: Data Sharing, DataGov e Open Data

Piattaforme di Data SharingS

cu

ola

SIS

“W

eb

e S

tati

sti

ca”

Page 39: Data Sharing, DataGov e Open Data

Web ScrapingS

cu

ola

SIS

“W

eb

e S

tati

sti

ca”

Page 40: Data Sharing, DataGov e Open Data

Le Stelline di Tim B. LeeS

cu

ola

SIS

“W

eb

e S

tati

sti

ca”

Page 41: Data Sharing, DataGov e Open Data

Ma…gli Open Data stanno funzionando?

Scu

ola

SIS

“W

eb

e S

tati

sti

ca”

Page 43: Data Sharing, DataGov e Open Data

Un passaggio necessarioS

cu

ola

SIS

“W

eb

e S

tati

sti

ca” Dati sulla Rete

Dati nella Rete

Page 44: Data Sharing, DataGov e Open Data

Connettersi ai DatiS

cu

ola

SIS

“W

eb

e S

tati

sti

ca”

Data Producer

Data Consumer

Page 45: Data Sharing, DataGov e Open Data

Connettersi ai DatiS

cu

ola

SIS

“W

eb

e S

tati

sti

ca”

Page 46: Data Sharing, DataGov e Open Data

Dati StrutturatiS

cu

ola

SIS

“W

eb

e S

tati

sti

ca”

Page 47: Data Sharing, DataGov e Open Data

Il “problema” dei MetadatiS

cu

ola

SIS

“W

eb

e S

tati

sti

ca”

88217

Page 48: Data Sharing, DataGov e Open Data

Il “problema” dei MetadatiS

cu

ola

SIS

“W

eb

e S

tati

sti

ca”

– Qual’è il SOGGETTO della misura?

– Qual’è l’UNITA’ di misura?

– Qual’è la REGIONE GEOGRAFICA a cui il dato siriferisce?

– QUANDO la misura è stata fatta?

Page 49: Data Sharing, DataGov e Open Data

Il “problema” dei MetadatiS

cu

ola

SIS

“W

eb

e S

tati

sti

ca”

Dietro ognuna di queste domande, c’è una idea o CONCETTO che viene usato per descrivere i dati

– Il Soggetto è “popolazione totale"

– L’unità di misura è “persone"

– Il riferimento territoriale è “Comune di Pisa"

– Il Tempo è “31 Dicembre 2010"

Page 50: Data Sharing, DataGov e Open Data

Il “problema” dei MetadatiS

cu

ola

SIS

“W

eb

e S

tati

sti

ca”

Possiamo quindi dire che:

La popolazione totale del comune di Pisa al

31 dicembre 2010 è di 88217 unità

Page 51: Data Sharing, DataGov e Open Data

Il problema dei MetadatiS

cu

ola

SIS

“W

eb

e S

tati

sti

ca”

I metadati strutturati devono essere associati

ai dati, altrimenti diventa impossibile

identificare, ritrovare e navigare attraverso i dati

Page 52: Data Sharing, DataGov e Open Data

La struttura dei datasetS

cu

ola

SIS

“W

eb

e S

tati

sti

ca”

Computers need structure

of data

•Concepts and terms

•Code lists

•Data values

•How these fit together

Unit Multiplier

Unit

Topic

Time/Frequency

Country

Stock/Flow

Page 53: Data Sharing, DataGov e Open Data

La struttura dei datasetS

cu

ola

SIS

“W

eb

e S

tati

sti

ca”

Topic

A Brady Bonds

B Bank Loans

C Debt

Securities

Country

AR Argentina

MX Mexico

SA South Africa

Stock/Flow

1 Stock

2 Flow

Concepts

TOPIC

COUNTRY

FLOW

Page 54: Data Sharing, DataGov e Open Data

La struttura dei datasetS

cu

ola

SIS

“W

eb

e S

tati

sti

ca”

16457

Page 55: Data Sharing, DataGov e Open Data

Data Structure DefinitionS

cu

ola

SIS

“W

eb

e S

tati

sti

ca”

The simplest explanation of a data structure definition is that it is a set of descriptor concepts, associated with a set of data, which allow us to understand what that data means.

Page 56: Data Sharing, DataGov e Open Data

Data Structure DefinitionS

cu

ola

SIS

“W

eb

e S

tati

sti

ca” • Dimension (e.g. frequency, reference area):

• Attribute (e.g. title, observation status):

• Measure (e.g. turnover index, # of births, # of deaths):

• Groups:

– Grouping of dimensions in order to attach group attributes (e.g. sibling group)

Page 57: Data Sharing, DataGov e Open Data

Data Structure DefinitionS

cu

ola

SIS

“W

eb

e S

tati

sti

ca”

Year Month

Turnover

index Status Confidentiality

2002 January 84.5 actual free

2002 February 85.6 actual free

2002 March 95.4 actual free

2002 April 106.2 actual free

2002 May 98.0 actual free

2002 June 95.3 actual free

2002 July 105.4 actual free

2002 August 107.1 actual free

2002 September 105.2 actual free

2002 October 109.4 actual free

2002 November 104.5 actual free

2002 December 111.9 actual free

2003 January 89.1 provisional free

2003 February 88.3 provisional free2003 March 96.1 provisional free

Source: National Statistical Service of Greece

Data prepared to be transmitted to the European Commission (including EUROSTAT)

Table 1. Deflated turnover index (on volume of sales) for retail trade for Greece

(no adjustment). Reference period: January 2002 to March 2003.

(monthly data - Base year: 2000)

Page 58: Data Sharing, DataGov e Open Data

Data Structure DefinitionS

cu

ola

SIS

“W

eb

e S

tati

sti

ca”

Year Month

Turnover

index Status Confidentiality

2002 January 84.5 actual free

2002 February 85.6 actual free

2002 March 95.4 actual free

2002 April 106.2 actual free

2002 May 98.0 actual free

2002 June 95.3 actual free

2002 July 105.4 actual free2002 August 107.1 actual free

2002 September 105.2 actual free

2002 October 109.4 actual free

2002 November 104.5 actual free2002 December 111.9 actual free

2003 January 89.1 provisional free

2003 February 88.3 provisional free

2003 March 96.1 provisional freeSource: National Statistical Service of Greece

Data prepared to be transmitted to the European Commission (including EUROSTAT)

Table 1. Deflated turnover index (on volume of sales) for retail trade for Greece

(no adjustment). Reference period: January 2002 to March 2003.

(monthly data - Base year: 2000)

Dimensions

Measure

Attributes

Page 59: Data Sharing, DataGov e Open Data

<? XML ?>S

cu

ola

SIS

“W

eb

e S

tati

sti

ca”

http://demo.istat.it/api_demo/?q=getpopolazione&prov=0

12&com=012

Page 60: Data Sharing, DataGov e Open Data

SDMX FrameworkS

cu

ola

SIS

“W

eb

e S

tati

sti

ca”

Page 61: Data Sharing, DataGov e Open Data

Census HubS

cu

ola

SIS

“W

eb

e S

tati

sti

ca”

Page 62: Data Sharing, DataGov e Open Data

Il Web “Classico”S

cu

ola

SIS

“W

eb

e S

tati

sti

ca”

The Emerging Web of Linked Data - Chris Bizer, Freie

Universität Berlin

Il Web è una ragnatela di documenti collegati tra loro,

per l'utilizzo umano

Page 63: Data Sharing, DataGov e Open Data

API e Mash-UpS

cu

ola

SIS

“W

eb

e S

tati

sti

ca”

The Emerging Web of Linked Data - Chris Bizer, Freie

Universität Berlin

http://cheapguru.org/comuni/

Page 64: Data Sharing, DataGov e Open Data

Semantic WebS

cu

ola

SIS

“W

eb

e S

tati

sti

ca”

Il Semantic Web è una

ragnatela di informazioni

connesse dalla semantica.

L’idea è di generare

documenti che possano al

tempo stesso essere letti e

compresi da esseri umani,

ma anche acceduti ed

interpretati da agenti

automatici alla ricerca di

contenuti.

Page 65: Data Sharing, DataGov e Open Data

Linked DataS

cu

ola

SIS

“W

eb

e S

tati

sti

ca”

The Emerging Web of Linked Data - Chris Bizer, Freie

Universität Berlin

Usa le tecnologie del Semantic Web per

1. Pubblicare dati strutturati sul Web,

2. definire link tra dati di fonti diverse

Page 66: Data Sharing, DataGov e Open Data

RDFS

cu

ola

SIS

“W

eb

e S

tati

sti

ca”

RDF (Resource Description Framework) è lo strumento proposto dal W3C per

descrivere i metadati relativi ad una risorsa, mettendo a disposizione un

linguaggio per esprimere la semantica di una risorsa.

RDF è costituito da due componenti:

· RDF Model and Syntax: definisce il data model RDF e la sua codifica XML;

· RDF Schema: permette di definire specifici vocabolari per i metadati.

Page 67: Data Sharing, DataGov e Open Data

RDFS

cu

ola

SIS

“W

eb

e S

tati

sti

ca”

Una risorsa, identificata univocamente da un URI, viene descritta utilizzando il

data model RDF.

Questo modello è basato su tre oggetti:

Resource (risorsa): indica ciò che viene descritto mediante RDF e può essere

una risorsa Web (ad esempio una pagina HTML, un documento XML o parti di

esso) o anche una risorsa esterna al Web (ad esempio un libro, un quadro, etc.);

Property (proprietà): indica una proprietà, un attributo o una relazione utilizzata

per descrivere una risorsa. Il significato e le caratteristiche di questa componente

vengono definite tramite RDF Schema;

Statement (espressione): è l'elemento che descrive la risorsa ed è costituito da

un soggetto (che rappresenta la Resource), un predicato (che esprime la

Property) e da un oggetto (chiamato Value) che indica il valore della proprietà.

Page 68: Data Sharing, DataGov e Open Data

RDFS

cu

ola

SIS

“W

eb

e S

tati

sti

ca” Le triple: Soggetto, Predicato, Oggetto

Nella forma più semplice, il concetto può essere

applicato a frasi come:

„John drinks tea‟

„David likes apple‟

„Italy hasCapital Rome‟

Essentialmente, una tripla RDF mette in relazione

risorse and dati insieme, indicando “come”

Page 69: Data Sharing, DataGov e Open Data

RDFS

cu

ola

SIS

“W

eb

e S

tati

sti

ca”

ItalyhasCapital

Rome

http://example.org/countries/Italy

Page 70: Data Sharing, DataGov e Open Data

RDFS

cu

ola

SIS

“W

eb

e S

tati

sti

ca”

Italy RomehasCapital

0580912761477

areaCodepopulation

http://example.org/countries/Italy

http://example.org/cities/Rome

Dove hasCapital è l’occorrenza di un

vocabolario condiviso, che diventa così

un identificatore universale a cui viene

associato un significato specifico

Page 71: Data Sharing, DataGov e Open Data

Linked DataS

cu

ola

SIS

“W

eb

e S

tati

sti

ca”

E’ un approccio per pubblicare dati sul Web,

permettendo di linkare dataset insieme usando

riferimenti a concetti comuni

http://baseculturale.it/

Page 72: Data Sharing, DataGov e Open Data

RDF Data CubeS

cu

ola

SIS

“W

eb

e S

tati

sti

ca”

http://schemapedia.com/schemas/qb

Il vocabolario Data Cube permette la

pubblicazione di dati e di statistiche

multidimensionali in modo da essere linkati ai

relativi dataset e concetti. Il modello alla base del

vocabolario Data Cube è compatibile con il

modello descritto da SDMX

(Statistical Data and Metadata eXchange)

Page 73: Data Sharing, DataGov e Open Data

RDFS

cu

ola

SIS

“W

eb

e S

tati

sti

ca”

Page 74: Data Sharing, DataGov e Open Data

ISTAT Linked DataS

cu

ola

SIS

“W

eb

e S

tati

sti

ca”

Page 75: Data Sharing, DataGov e Open Data

Eurostat Linked DataS

cu

ola

SIS

“W

eb

e S

tati

sti

ca”

Page 76: Data Sharing, DataGov e Open Data

Open Data e interoperabilitàS

cu

ola

SIS

“W

eb

e S

tati

sti

ca”

L’interoperabilità è dunque un elemento chiave di uno

degli aspetti più innovativi offerti dagli open data: l’uso

dei dati in modi e per scopi “inattesi”, nuovi in quanto

non previsti dai singoli enti e soggetti che pubblicano i

“dati grezzi”.

Page 77: Data Sharing, DataGov e Open Data

Una sfida per il futuroS

cu

ola

SIS

“W

eb

e S

tati

sti

ca”

Page 78: Data Sharing, DataGov e Open Data

Il lavoro più sexy?S

cu

ola

SIS

“W

eb

e S

tati

sti

ca”

Hal Varian

Page 79: Data Sharing, DataGov e Open Data

Il lavoro più sexy?S

cu

ola

SIS

“W

eb

e S

tati

sti

ca”

Hal Varian

Page 80: Data Sharing, DataGov e Open Data

Il ruolo dello statisticoS

cu

ola

SIS

“W

eb

e S

tati

sti

ca”

Michael Driscoll

Page 81: Data Sharing, DataGov e Open Data

Scu

ola

SIS

“W

eb

e S

tati

sti

ca”

Grazie dell’attenzione

[email protected]

[email protected]

References:1. http://www.linkedopendata.it/semantic-web

2. http://linkeddatabook.com/editions/1.0/

3. http://segnalazionit.org/2010/01/statistico-su-youtube/

4. http://www.wiwiss.fu-berlin.de/en/institute/pwo/bizer/research/publications/Bizer-

SRIinternational-LinkedDataTalk.pdf

5. http://www.cs.unibo.it/~fabio/corsi/ltw01/slides/19-RDF/19-RDF.pdf

6. http://www.slideshare.net/jindrichmynarz/statistical-data-in-rdf

7. http://www.slideshare.net/patruno/sdmxedi-and-sdmxml

8. http://www.slideshare.net/patruno/census-hub-project