MELODA una métrica de la reutilización -...
Transcript of MELODA una métrica de la reutilización -...
YOUR LOGO
¿Por que publicamos la información?MELODA una métrica de la reutilización
Alberto Abella@aabella
XVII JORNADA DE GESTIÓN DE LA INFORMACIÓNXVII JORNADA DE GESTIÓN DE LA INFORMACIÓN
Madrid. Datos.madrid.es
198 descargas desde 15-4-2014
1.07 al día
http://bit.ly/volunariosmadrid
198 descargas desde 15-4-2014
1.07 al día
http://bit.ly/volunariosmadrid
XVII JORNADA DE GESTIÓN DE LA INFORMACIÓNXVII JORNADA DE GESTIÓN DE LA INFORMACIÓN
Madrid. Datos.madrid.es
14 apps oficiales utilizando los datos de datos.madrid.es
14 apps oficiales utilizando los datos de datos.madrid.es
XVII JORNADA DE GESTIÓN DE LA INFORMACIÓNXVII JORNADA DE GESTIÓN DE LA INFORMACIÓN
España. Datos.gob.es
2 descargas
desde 15-4-2011 (posiblemente)
http://datos.gob.es/catalogo/anejo-fotografico-de-tarazona-moncayo-c12album
2 descargas
desde 15-4-2011 (posiblemente)
http://datos.gob.es/catalogo/anejo-fotografico-de-tarazona-moncayo-c12album
XVII JORNADA DE GESTIÓN DE LA INFORMACIÓNXVII JORNADA DE GESTIÓN DE LA INFORMACIÓN
Hay 1 (encontrada)
Es oficial
1000 descargas
Hay 1 (encontrada)
Es oficial
1000 descargas
BNE. Apps
XVII JORNADA DE GESTIÓN DE LA INFORMACIÓNXVII JORNADA DE GESTIÓN DE LA INFORMACIÓN
Copyright BNE 2015Copyright BNE 2015
BNE. Licencia catalogo datos
XVII JORNADA DE GESTIÓN DE LA INFORMACIÓN
Barcelona: ● 100.000 to 500.000 downloads● Basada en scraping de la web ● Multiplicó por 5 durante tiempo a su competidor oficial
Barcelona: ● 100.000 to 500.000 downloads● Basada en scraping de la web ● Multiplicó por 5 durante tiempo a su competidor oficial
Barcelona. Eduard Ereza
XVII JORNADA DE GESTIÓN DE LA INFORMACIÓNXVII JORNADA DE GESTIÓN DE LA INFORMACIÓN
Helsinki. Apps usando open data
Helsinki
621.000 habitantes
136 apps
Helsinki
621.000 habitantes
136 apps
XVII JORNADA DE GESTIÓN DE LA INFORMACIÓN
1 OGOV Active Passive
2 Goals Service’s improvementHaving lots of people in well designed sites
3 ParticipantsRepresentative citizens’ sample
Those willing to participate
4 Info. Release Actual demand and useAuthorities’ interests and availability
5 Timeliness ASAP Once reviewed
6 Applications Ecosystem of developers Own development
7 Participation Commitment to answer Just open
8 Training In place No (just principles)
Ogov pasivo vs activo
Source: Abella, Ortiz-de-Urbina and De Pablos (2015)
SI NO
XVII JORNADA DE GESTIÓN DE LA INFORMACIÓN
De centralizado a colaborativo
Todos los desarrollos
son propios No hay alternativas
para grupos de usuarios
Conexión limitada en caso existir
Centralizado
● Los recursos se comparten con los usuarios
● Propiedad central cesión derechos uso
Ecosistema reutilizadores
Promoción Feedback
Compartido
● Red de nodos conectados por plataformas / protocolos comunes
Comparten datos u otros recursos digitales
Propiedad datos distribuida
Colaborativo
Control Ecosistema Impacto
MODELOS COLABORACIÓN
Eficiencia recursos propios
XVII JORNADA DE GESTIÓN DE LA INFORMACIÓN
Ecosistemas digitales
Smart City Ecosystem Society
External digital assets
SC Digital assets
SC Data demandFixed data
Services delivered
Services demand
Added value processes
Source: Abella, Ortiz-de-Urbina and De Pablos (2015)
Data source
XVII JORNADA DE GESTIÓN DE LA INFORMACIÓN
Citizen Experience
SERVICE experience
Innovation
SaveTime
Trust
Stage impact on attribute
Channel impact on attribute
TOUCHPOINTS
Office Call Center … ATM
Discover Brand
Use of services
Discover Brand
…. … … … …
Finishing
LIFECYCLE PHASE
Driver 1 (x %)
Driver 3 (z %)
Driver 2 (y %)
Driver 4 (t %)
Driver 5 (a %)
Driver 6 (b %)
Attribute
Driver For every attribute of experience
XVII JORNADA DE GESTIÓN DE LA INFORMACIÓN
Source http://www.ncbi.nlm.nih.gov/pubmed/15794461
Impacto de la publicación datos
Los Angeles county
Publicación calificación sanitaria restaurantes
13.1 descenso ingresos hospitalarios
Los Angeles county
Publicación calificación sanitaria restaurantes
13.1 descenso ingresos hospitalarios
XVII JORNADA DE GESTIÓN DE LA INFORMACIÓN
Impacto de la publicación datos
Reusabilitydegree
Reusevalue
Economic and socialvalue
Open dataProducts/services
Distribution and/or commercialization
Products / servicesdevelopment
Open dataSmart cities datasets
Inbound open innovation
Apps development
Outbound open innovation
Apps Social and market value
Stage 1 Stage 2 Stage 3
Source: Abella, Ortiz-de-Urbina and De Pablos (2015)
XVII JORNADA DE GESTIÓN DE LA INFORMACIÓN
Factores reutilización datos. Legal
Legal
- Licencia de reutilización
- Uso comercial
- Compatibilidad entre licencias
Con la condición
- No desnaturalización
- Actualización
Legal
- Licencia de reutilización
- Uso comercial
- Compatibilidad entre licencias
Con la condición
- No desnaturalización
- Actualización
XVII JORNADA DE GESTIÓN DE LA INFORMACIÓN
Cambios en licencias de datos
Copyright and restrictive licensing Commercial & only attribution0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
84%
16%12%
88%
2011
2013
Fuente: Abella (2013)
XVII JORNADA DE GESTIÓN DE LA INFORMACIÓN
Factores reutilización datos. Acceso
Acceso
• Registro oficial
• Acceso a todos los datos
• API
• Query / SPARQL
Acceso
• Registro oficial
• Acceso a todos los datos
• API
• Query / SPARQL
«Vandalproof» de Originally first uploaded by Bottesini of the English Wikipedia, converted to PNG by 98E of the English Wikipedia, and then edited to look better by Rappingwonders2. - Originally converted to PNG from Image:Vandalprooflock.jpg, edited to look better by User:Rappingwonders2.. Disponible bajo la licencia CC BY-SA 3.0 vía Wikimedia Commons - http://commons.wikimedia.org/wiki/File:Vandalproof.png#/media/File:Vandalproof.png
XVII JORNADA DE GESTIÓN DE LA INFORMACIÓN
Factores reutilización datos. Acceso
-15% -10% -5% 0% 5% 10% 15% 20%2
2.2
2.4
2.6
2.8
3
3.2
3.4
3.6
3.8
4LOCAL
Linear (LOCAL)
NATIONAL
Linear (NATIONAL)
REGIONAL
Linear (REGIONAL)
Increment use 12-11
Acc
ess
dim
en
s io
n
Legal
Legal
Legal
Transport
Transport
Transport (L)
Meteo
Meteo
Meteo (R)
Geograhic
Geograhic
Geograhic
Social
Social
Social
Other
Other
Other
Business
Business
Business
Muestra (2013)
• 204 fuentes (España)
• 7 categorías datos
•Ambito nacional, regional y local
•MELODA 2.5
Muestra (2013)
• 204 fuentes (España)
• 7 categorías datos
•Ambito nacional, regional y local
•MELODA 2.5
XVII JORNADA DE GESTIÓN DE LA INFORMACIÓN
Factores reutilización. Estándares técnicos
Estándares técnicos
• No influyen tanto
• Pueden incluir los metadatos
• Pueden condicionar la herramienta uso
•Estándares geográficos (INSPIRE)
Estándares técnicos
• No influyen tanto
• Pueden incluir los metadatos
• Pueden condicionar la herramienta uso
•Estándares geográficos (INSPIRE)
"Master lock" by Dhscommtech at English Wikipedia. Licensed under CC BY-SA 3.0 via Wikimedia Commons - https://commons.wikimedia.org/wiki/File:Master_lock.JPG#/media/File:Master_lock.JPG
XVII JORNADA DE GESTIÓN DE LA INFORMACIÓN
Factores reutilización. Modelo de datos
Modelo de datos
- Documentado
- Publicado
- Compartido
- Normalizado
- Utilizado
Posiblemente el de mayor impacto
No nos valen las 5 estrellas
Modelo de datos
- Documentado
- Publicado
- Compartido
- Normalizado
- Utilizado
Posiblemente el de mayor impacto
No nos valen las 5 estrellas
CC Attribution IvanWalsh.com
XVII JORNADA DE GESTIÓN DE LA INFORMACIÓN
Factores reutilización. Geolocalización
Geolocalización
- Añade valor
- En los datasets más utilizados
Geolocalización
- Añade valor
- En los datasets más utilizados
"World Heat Engine" by NASA / Goddard - Image n.0300805 "The World Revs its Heat Engine"http://mix.msfc.nasa.gov/abstracts.php?p=2622http://nasaimages.org/luna/servlet/detail/nasaNAS~9~9~58656~162500http://www.flickr.com/photos/nasacommons/5053572594/. Licensed under Public Domain via Wikimedia Commons - https://commons.wikimedia.org/wiki/File:World_Heat_Engine.jpg#/media/File:World_Heat_Engine.jpg
XVII JORNADA DE GESTIÓN DE LA INFORMACIÓN
Factores reutilización. Tiempo real
Tiempo real
De acuerdo al proceso que los genera
Conexión en directo a los datos
Mayoritariamente presente en los datos más reutilizados
Tiempo real
De acuerdo al proceso que los genera
Conexión en directo a los datos
Mayoritariamente presente en los datos más reutilizados
XVII JORNADA DE GESTIÓN DE LA INFORMACIÓN
Metrica reutilización
MELODA
4 Dimensiones de análisis
Varios niveles en cada dimensión
Cada nivel está ponderado
MELODA
4 Dimensiones de análisis
Varios niveles en cada dimensión
Cada nivel está ponderado
MELODA: Tabla de dimensiones y nivelesDimensiones
Niveles
XVII JORNADA DE GESTIÓN DE LA INFORMACIÓN
Metrica reutilización
MELODA
4 Dimensiones análisis
Varios niveles en cada dimensión
Cada nivel está ponderado
MELODA
4 Dimensiones análisis
Varios niveles en cada dimensión
Cada nivel está ponderado
MELODA: Ponderación de niveles
Dimensiones
Niveles
XVII JORNADA DE GESTIÓN DE LA INFORMACIÓN
Metrica reutilización
MELODA
MEtric for reLeasing Open DAta
- Cuantificar la reusabilidad de fuentes de información
- Relacionarla con su reutilización
- Relacionarla con el valor creado
- Accesible en meloda.org
MELODA
MEtric for reLeasing Open DAta
- Cuantificar la reusabilidad de fuentes de información
- Relacionarla con su reutilización
- Relacionarla con el valor creado
- Accesible en meloda.org
Proceso evaluación
Estándar técnico
Legal
Acceso
Juego datos
Meloda 3.10
M3.10
Ponderación
Ponderación
Pondera
Criterios
Nivel
Nivel
Nivel
Paso 1.Evaluación
Paso 2.Ponderación
Paso 3.Obtenciónvalor
ValorMétrica MELODA
Modelo de datos
Nivel
Ponderación
Ponderación
Cualificación Reusabilidad
Paso 4.Calificaciónreusabilidad
XVII JORNADA DE GESTIÓN DE LA INFORMACIÓN
Metrica reutilización. Ejemplo
MELODA
La Biblioteca A publica un conjunto de datos como linked data pero con un modelo de datos propio, con licencia de uso comercial, y con un mecanismo por el cual se puede utilizar un recurso SPARQL para interrogar el conjunto de datos. Los niveles que tiene en cada dimensión son los siguientes:
Dimensión estándares técnicos: Nivel 3 (RDF con metadatos) → 100%
Dimensión acceso: Nivel 5 (Interrogable vía SPARQL) → 100%
Dimensión legal: Nivel 4 (comercial) → 90%
Dimensión Modelo de datos: Nivel 2 (modelo de datos ad hoc) → 30%
MELODA
La Biblioteca A publica un conjunto de datos como linked data pero con un modelo de datos propio, con licencia de uso comercial, y con un mecanismo por el cual se puede utilizar un recurso SPARQL para interrogar el conjunto de datos. Los niveles que tiene en cada dimensión son los siguientes:
Dimensión estándares técnicos: Nivel 3 (RDF con metadatos) → 100%
Dimensión acceso: Nivel 5 (Interrogable vía SPARQL) → 100%
Dimensión legal: Nivel 4 (comercial) → 90%
Dimensión Modelo de datos: Nivel 2 (modelo de datos ad hoc) → 30%
√√100 ·100 ·90 ·30 =72.08
XVII JORNADA DE GESTIÓN DE LA INFORMACIÓNXVII JORNADA DE GESTIÓN DE LA INFORMACIÓN
Informe reusabilidad
XVII JORNADA DE GESTIÓN DE LA INFORMACIÓN
Alberto Abella
Activismo: Open Knowledge Foundation Spain
Academia: Universidad Rey Juan Carlos
Sociedad información : AMETIC
Sector Privado: Brain Trust
Activismo: Open Knowledge Foundation Spain
Academia: Universidad Rey Juan Carlos
Sociedad información : AMETIC
Sector Privado: Brain Trust
Contacto: @aabella [email protected]