Marco Broccoli, Fabrizio De Fausti Big data for official statistics: nuovi strumenti

17
Big data for official statistics: nuovi strumenti per la misurazione dei flussi traffico Marco Broccoli* Fabrizio De Fausti** ISTAT Direzione centrale per la metodologia e il disegno dei processi statistici *Servizio MEA **Servizio MEC Roma, 7 novembre 2016 Istituto Nazionale di Statistica - Aula Magna

Transcript of Marco Broccoli, Fabrizio De Fausti Big data for official statistics: nuovi strumenti

Big data for official statistics: nuovi strumenti per la

misurazione dei flussi traffico

Marco Broccoli* Fabrizio De Fausti**

ISTAT

Direzione centrale per la metodologia e il disegno dei processi statistici

*Servizio MEA

**Servizio MEC

Roma, 7 novembre 2016Istituto Nazionale di Statistica - Aula Magna

Outline

Big Data come nuove fonti di dati

Incidenti stradali e progetti di riferimento

Dall’incidentalità al rischio

Dai video ai dati: T-REX

La sperimentazione con ANAS

Big Data

Con il termine Big data si intende una raccolta di dati così estesa in termini di volume, velocità e varietà da richiedere tecnologie e metodi analitici specifici per l'estrazione di valore.

Big Data

Produciamo e immagazziniamo una quantità enorme d'informazione.Nel 2012 ogni giorno si producevano 2,5 x 10^18 byte*

*"IBM What is big data? – Bringing big data to the enterprise". www.ibm.com. Retrieved 2013-08-26.

Big Data

BIG DATA

Le grandi aziende stanno investendo miliardi di dollari in questo settore perché sono produttori naturali di BIG DATA che utilizzano per ricavarne nuovo profitto.

Big Data

BIG DATA

Problematica nuova

No profitto ma statistica ufficiale

La quarta 'V' : VERIDICITA'

Principali progetti di riferimento

Il contesto da cui partiamo:

RSPI: Road Safety Performance Indicators presso la Commissione Europea (DG-MOVE);

CARE/CADAS: Community for Road Accidents Database/Common Accident Data Set presso la Commissione Europea (DG-MOVE).

SIRIS: Sistema Informativo Rilevazione Incidentalità Stradale Popolamento database relazionale di produzionePopolamento datawarehouse di diffusione datiProduzione delle tavole statistiche in Excel;

Dal dato assoluto alla costruzione di indicatori e misure relative

La diffusione di dati in forma tabellare e con valori assoluti non consente di interpretare pienamente il fenomeno.

La costruzione di indicatori sintetici e probabilità effettive della rischiosità sulle strade fornirebbe un rilevante valore aggiunto.

Stima di flussi e Big Data

Stima del rischio stradale

Stima dei flussi di traffico sulle maggiori arterie stradali

Accordi con i gestori

WEB

Reperiti nel WEB

TREx software

Processare video e immagini: TREX – Traffic Reader Experimetal tool

Funzionalità:

Analizzare le principali caratteristiche del video

Passare da una serie di immagini ad un video e viceversa

Disegnare sensori virtuali di conteggio sulla corsia.

Disegnare sensori virtuali di conteggio sull'intera carreggiata

Disegnare sensori virtuali di conteggio di veicoli presenti in un area.

Scritto in VisualBasic e Python

Piattaforma OpenCV

OpenCV: Open source Computer Vision

Matrice di riferimento

+ +

+ +..) =

1/N(

Aritmetica delle immagini.... le immagini digitali sono matrici di numeri

Sensori

Sensori di corsia

Sensori

Sensori di carreggiata

Sensori

Sensori di area

Sperimentazione Anas

Fornitura dei video di 4 videocamere site lungo il del G.R.A.

Periodo di tempo: 7 Giorni

Conteggio con le diverse tipologie di sensori e creazione di tabelle orarie

Creazione di un modello statistico dei dati racconti con i dati forniti da GoogleMaps.

Marco Broccoli                                 Fabrizio De FaustiIstat

Direzione centrale per la metodologia e il disegno dei processi statistici

www.istat.it

[email protected]@istat.it 

Si ringraziano per la collaborazione, professionalità e competenza mostrata:

Pierpaolo  Cartolano  (Anas­Direzione  Operation  e  Coordinamento Territoriale)Massimo Santopietro (Anas–Direzione ICT)Giuseppe Di Nezza (Anas Lazio)