Post on 07-Mar-2015
Global Biodiversity Information Facility
GLOBALBIODIVERSITYINFORMATIONFACILITY
Francisco Pando
Data Digitalization Workshop
Braga, 5 a 7 de Julho, 2006
WWW.GBIF.ORG
A tecnologia da Informação e o GBIF
Global Biodiversity Information Facility
Sumario
Objetivo y visión de GBIF
Red de datos
Esquemas de datos
Puntos y nombres
Protocolos
Registro de bases de datos
Portales
Estrategias, opciones e implementaciones para compartir datos
Global Biodiversity Information Facility
Objetivo de GBIF
GBIF se propone hacer accesible por Internet toda la información disponible sobre los organismos vivos conocidos a nivel mundial
Otra manera de verlo; se propone cambiar la cultura de “mi dato es mio, mira mis resultados” (en ciencia y en gestión)
“datos de todos para todos”
Global Biodiversity Information Facility
Modelo de datos: redes centralizadasModelo de datos: redes centralizadas
Global Biodiversity Information Facility
Red de datos distribuidosRed de datos distribuidos
Col 1
Col 2
Col 3
Col 4
Col 5
programa
buscar
interface
Win2000Brahms
LinuxMySQL
Win98Access
Win98biota FreeeBSD
PostgreSQL
Communication Protocol
Data Model
Figure 4. Diagram showing the complexity of integrating data from biological collections
Global Biodiversity Information Facility
Los elementos de la redLos elementos de la red
Figure 5. GBIF Network: major classes of nodesGBIF is responsible for running the network, establishing standards, and developing tools. The portal is the hub for the development of any service that must be centralized such as the registry of metadata and for serving data from the biodiversity data index to the end user.
Global Biodiversity Information Facility
Más en detalleMás en detalle
ProtocolProviderPortalRegistry
Global Biodiversity Information Facility
Tecnologias usadasTecnologias usadas• XML data exchange based on Providers, Services and Biodiversity Data Records
• UDDI registry for technical (access) metadata
• Descriptive metadata retrieved through service interfaces
• Specimen/observation exchange using DiGIR-Darwin Core or BioCASE-ABCD
• Taxonomic name data from Catalogue of Life (annual checklist for first release, moving to service-based approach as possible)
• Java (and JSP) components being developed centrally for GBIF Portal
• Current portal development using Tomcat, Xerces, Log4J, MySQL
• Components to be packaged for reuse as appropriate
Global Biodiversity Information Facility
Mapeo de datosMapeo de datos
Portal
ProfileSchema
Data Provider System
Data
DiGIRProvider
Data MapSchema
Data Provider System
Data
DiGIRProvider
Data MapSchema
Global Biodiversity Information Facility
Esquemas datosEsquemas datos
Darwin Core Sencillo (50 elementos) La unidad es el registro 500 bases de datos www.gbif.net
ABCD Contenido elaborado y detallado (+500
elementos) La unidad es el archivo 170 bases de datos en www.gbif.net
Global Biodiversity Information Facility
La base para el acceso unificado:
La base para el acceso unificado: Perfil común:
Cada base de datos se traduce a un “perfil común”, que es una tabla con una lista estandarizada de campos que se pueden consultar de manara uniforme
Estándares: ”Darwin Core” ABCD Schema www.tdwg.org
Global Biodiversity Information Facility
Darwin Core, desarrollos en cursoDarwin Core, desarrollos en curso Soporte para imágenes
Extensiones
Global Biodiversity Information Facility
Darwin Core, extensionesDarwin Core, extensiones
Global Biodiversity Information Facility
Integración de nombres y especímenesIntegración de nombres y especímenes
Global Biodiversity Information Facility
ProtocolosProtocolos
DIGIR para Darwin Core
Biocase para ABCD
Global Biodiversity Information Facility
Vida despues de DIGIRVida despues de DIGIR
TAPIR http://www.gbif.org/News/NEWS1129877273 http://ww3.bgbm.org/protocolwiki/ Unificar protocolos de la red de datos de
GBIF Expansión del registro (UDDI), soporte
para redes temáticas, portales nacionales, extensiones de Darwin core
Toolkit para portales de datos en desarrollo
Global Biodiversity Information Facility
RegistroRegistroA tener en cuenta:
•Un nombre caracteristico•Una descrición que oriente al usuario•Condiciones de uso adicionales•Como citar el uso de este recurso
Global Biodiversity Information Facility
Portales de GBIFPortales de GBIF
Portal actual (prototipo) Portal para nodos Nuevo portal (en desarrollo)
Global Biodiversity Information Facility
Portal actual (prototipo)Portal actual (prototipo)
Search only by scientific or vernacular names (optional country filter)
Global Biodiversity Information Facility
Portal actual (prototipo)Portal actual (prototipo)
Data resources with specimens or observations
Occurrence Detail
Download records
Georeferenced recordsCountries from which
species is recorded
Global Biodiversity Information Facility
Portal para NodosPortal para Nodos
En desarrollo Para que los nodos puedan servir:
Datos de las colecciones de su ámbito (país)
Datos relevantes para su ámbito Adaptable a sus necesidades (idioma,
nombres comunes,…) Proporcionar una ayuda para que los
nodos puedan servir a sus comunidades
Global Biodiversity Information Facility
Nuevo portalNuevo portal
Estilo www.biologybrowser.com Web services API interfaz Servicios añadidos de indexado y
validación
Torres & Pando 2nd ENBI Forums 2005
23Data resources
Resource crawler
Interpretation and validation
Data despatcher
Synchronised data stores
Web applications
Mirrored access
Clients
Portalarchitecture(new versionD. Hobern)
Global Biodiversity Information Facility
¿Más o menos claro?¿Más o menos claro?
ProtocolProviderPortalRegistry
Global Biodiversity Information Facility
Estandares para la integración de datos y la iinteroperabilidad
Estandares para la integración de datos y la iinteroperabilidad
http://www.tdwg.org/standrds.html
Global Biodiversity Information Facility
Apoyo técnico: helpdesk@gbif.org
”Turn-key package”
Basado en PHP y código del proyecto DiGIR
Para Linux y Windows
Registro con el UDDI del GBIF
Global Biodiversity Information Facility
De las bases de datos al acceso via InternetDe las bases de datos al acceso via Internet
¿De quien son esos datos?
¿Todo, todo?
¿Como de limpio?
¿Como?
Global Biodiversity Information Facility
¿De quien son esos datos?¿De quien son esos datos?
Global Biodiversity Information Facility
¿Todo, todo?¿Todo, todo?
El proveedor de los datos retiene el control sobre lo que hace accesible: Hace pruebas Decide diluir la precisión de registros
de especies amenazadas o de datos de interés económico
No hace pública los datos de investigaciones en curso
Global Biodiversity Information Facility
¿Como de limpio?¿Como de limpio?
La perfección no existe El dato malo tampoco; un dato no es
bueno o malo intrínsicamente, sino que su bondad depende del uso
Hacer los datos públicos ayuda a su mejoramiento
Hay herramientas para mejorar los datos y GBIF estatrabajando en esto:
http://www.secretariat.gbif.net/datatester/index.jsphttp://www.gbif.org/prog/digit/data_quality
Global Biodiversity Information Facility
¿Como?¿Como?
Distribuído Centralizado
ParticipantPortal A
ParticipantPortal C
Data Warehouse
ParticipantPortal B
Data Warehouse
GBIFPortal
GBIFRegistry
GBIFIndex
Global Biodiversity Information Facility
A vuestra disposición:A vuestra disposición:
Francisco Pando
Nodes Liaison Officer
GBIF Secretariat
Universitetsparken 15
2100 Kobenhavn, Dinamarca
pando@gbif.org
Tél.: + 45 35 32 1470
Fax: + 45 35 32 1480