Basado en Principles of Data Quality by Arthur D. Chapman Isabel Ortega Maqueda Unidad de...

15
Usando los datos sobre especies Estudios taxonómicos, ecológicos, biogeográficos, filogenéticos Modelado de datos de especies Estudios de población y distribución de especies Estudios sobre especies amenazadas, sobre migración de especies. Impacto del cambio climático Ecología, Ecosistemas, Evolución y genética Planificación sobre la conservación de espacios protegidos Gestión de recursos naturales

Transcript of Basado en Principles of Data Quality by Arthur D. Chapman Isabel Ortega Maqueda Unidad de...

Page 1: Basado en Principles of Data Quality by Arthur D. Chapman Isabel Ortega Maqueda Unidad de Coordinación GBIF-ES ortega@gbif.es -----------------------------------------------------------

Usando los datos sobre especies

Estudios taxonómicos, ecológicos, biogeográficos, filogenéticos

Modelado de datos de especiesEstudios de población y distribución de

especiesEstudios sobre especies amenazadas, sobre

migración de especies. Impacto del cambio climáticoEcología, Ecosistemas, Evolución y genéticaPlanificación sobre la conservación de

espacios protegidosGestión de recursos naturales

Page 2: Basado en Principles of Data Quality by Arthur D. Chapman Isabel Ortega Maqueda Unidad de Coordinación GBIF-ES ortega@gbif.es -----------------------------------------------------------

Usando datos de especies• Agricultura, Montes y Pesca• Perspectivas basadas en productos

biológicos• Salud y seguridad públicas• Medicina forense• Control de fronteras y comercio ilegal

de especies• Educación y alcance público• Ecoturismo• Arte e Historia, Ciencias y política• Planificación de infraestructuras

humanas

Page 3: Basado en Principles of Data Quality by Arthur D. Chapman Isabel Ortega Maqueda Unidad de Coordinación GBIF-ES ortega@gbif.es -----------------------------------------------------------

Que es la ‘Calidad de los datos?Que es la ‘Calidad de los datos?

Una característica esencial y necesaria para que los datos sean “adecuados para el uso”.

El propósito general al describir la calidad de los datos de un registro concreto es describir la adecuación del registro para un uso particular que el usuario tenga en mente para dichos datos. Chrisman, 1991

Qué queremos decir con calidad ?

Basado en “Principles of Data Quality” by Arthur D. Chapman

Page 4: Basado en Principles of Data Quality by Arthur D. Chapman Isabel Ortega Maqueda Unidad de Coordinación GBIF-ES ortega@gbif.es -----------------------------------------------------------

Calidad - Datos Adecuados para el uso?

Adecuados para el uso:– La especie ‘A’ se encuentra en Tasmania?– La especie ‘A’ se encuentra en el Área de

conservación del patrimonio de Tasmania’?

Wandering Albatross,

New Zealand

Page 5: Basado en Principles of Data Quality by Arthur D. Chapman Isabel Ortega Maqueda Unidad de Coordinación GBIF-ES ortega@gbif.es -----------------------------------------------------------

Pérdida de la calidad

La pérdida de la calidad de los datos puede perderse durante varias etapas:

En el momento de la recolección Durante la digitalización Durante la documentación Durante el almacenamiento y conservación Durante el análisis y la manipulación En el momento de la presentación En el uso que se les dé

No minusvaloréis la tarea de la mejora de la calidad. Aparte del trabajo en equipo, la formación y la disciplina, no se requieren cualidades especiales. Todo el que quiera, podrá contribuir a ello. (Redman 2001).

Basado en “Principles of Data Quality” by Arthur D. Chapman

Page 6: Basado en Principles of Data Quality by Arthur D. Chapman Isabel Ortega Maqueda Unidad de Coordinación GBIF-ES ortega@gbif.es -----------------------------------------------------------

Principios de la calidad de datos

Es importante que la institución tenga:

– Una visión con respecto a la calidad de sus datos

– Una política para implementar esta visión

– Una estrategia para la implementación

– No llevar nunca esta labor a cabo sin planificación ni sin coordinación.

La experiencia demuestra que el tratamiento de los datos de forma organizada y sistemática consigue ahorrar a largo plazo gran cantidad de tiempo y da mayor valor a los datos.

Basado en “Principles of Data Quality” by Arthur D. Chapman

Page 7: Basado en Principles of Data Quality by Arthur D. Chapman Isabel Ortega Maqueda Unidad de Coordinación GBIF-ES ortega@gbif.es -----------------------------------------------------------

Manteniendo la calidad de los datos

Prevenir es mejor que curar, y es mucho más barato…

La prevención de errores nada tiene que hacer con los datos que ya existen en la base de datos. En estos casos, la validación y la corrección serán los importantes en el proceso hacia la calidad.

Corregir los datos y no hacer nada para prevenir los errores significa que los errores seguirán apareciendo sistemáticamente y no los reduciremos nunca.

Detectar las causas del error nos ayudará a prevenirlas.

Page 8: Basado en Principles of Data Quality by Arthur D. Chapman Isabel Ortega Maqueda Unidad de Coordinación GBIF-ES ortega@gbif.es -----------------------------------------------------------

Cadena de Información de la Calidad de datos

Asignar la responsabilidad para la calidad de los datos a quienes los han creado. Si esto no es posible, asignar la responsabilidad a quienes están tan cerca de la creación de los datos como sea posible.

(Redman 2001)

Page 9: Basado en Principles of Data Quality by Arthur D. Chapman Isabel Ortega Maqueda Unidad de Coordinación GBIF-ES ortega@gbif.es -----------------------------------------------------------

Principios de la calidad de datos

• Exactitud – Debemos tender a que el dato esté lo más próximo posible al valor real.

• Consistencia – Datos representados siempre de la misma forma: la visualización de los datos debe ser clara, consistente y sin ambigüedad:

Page 10: Basado en Principles of Data Quality by Arthur D. Chapman Isabel Ortega Maqueda Unidad de Coordinación GBIF-ES ortega@gbif.es -----------------------------------------------------------

Principios de la calidad de datos 2

• Efectividad – La probabilidad de que una tarea alcance los objetivos alcanzados.

–Ej: el porcentaje de registros para los cuales la latitud y la longitud pueden ser determinados exactamente.

• Eficiencia – producir los máximos resultados con los mínimos recursos. – Ej: optimizar los procesos de georreferenciación

ordenando por localidad y georreferenciandolos utilizando los mismos mapas para el conjunto de registros.

Page 11: Basado en Principles of Data Quality by Arthur D. Chapman Isabel Ortega Maqueda Unidad de Coordinación GBIF-ES ortega@gbif.es -----------------------------------------------------------

Principios de la calidad de datos 3

• Acesibilidad – cómo de accesibles son los resultados para los usuarios/el público.– Ej: la facilidad con la que los usuarios acceden a la

georreferenciación de una localidad particular que acaba de ser georreferenciada.

• Transparencia – hacer públicos los procedimientos y la documentación para el manejo de la colección, los análisis realizados, los informes y las actualizaciones.– Ej.: conocer los métodos con que han sido georreferenciados

un grupo de registros y disponer de la documentación asociada a esta tarea.

Page 12: Basado en Principles of Data Quality by Arthur D. Chapman Isabel Ortega Maqueda Unidad de Coordinación GBIF-ES ortega@gbif.es -----------------------------------------------------------

Principios de la calidad de datos 4

• Actualidad de los datos – se refiere a la frecuencia de actualización de los datos de la colección y sus informes.– ¿Cuándo fueron los datos actualizados por última vez?

– ¿Con qué frecuencia se actualizan y son puestos a disposición de los usuarios?

La frecuencia de actualización deben ser concretada y documentada.

Page 13: Basado en Principles of Data Quality by Arthur D. Chapman Isabel Ortega Maqueda Unidad de Coordinación GBIF-ES ortega@gbif.es -----------------------------------------------------------

También debemos tener en cuenta…Otras características que deben ser observadas son:

• Documentación: es un principio clave. Permite a los usuarios verificar el ajuste de los datos al uso que necesitan en ese momento.

• Feedback: debe definir mecanismos para la retroalimentación a través de los usuarios, y hacer que esta información se refleje en la calidad de los datos.

• Formación y entrenamiento del personal: debe incluir desde los colectores, hasta los operadodes de digitalización de los datos y los gestores de las bases de datos.

• Crear protocolos de actuación que sirvan de base para la formación del personal, y para las tareas del día-a-día.

Page 14: Basado en Principles of Data Quality by Arthur D. Chapman Isabel Ortega Maqueda Unidad de Coordinación GBIF-ES ortega@gbif.es -----------------------------------------------------------

Errores en los datos

Ya que el error es algo ineludible, debería ser reconocido como una dimensión fundamental del dato.

Y necesita ser detectado, registrado y documentado.

Chrisman, 1991

En general, un buen entendiemiento de los errores y su propagación conduce a un control activo de la calidad

.Burrough and McDonnell, 1998

Page 15: Basado en Principles of Data Quality by Arthur D. Chapman Isabel Ortega Maqueda Unidad de Coordinación GBIF-ES ortega@gbif.es -----------------------------------------------------------

Alguna pregunta?