Designing and developing vocabularies in rdf et
-
Upload
open-data-support -
Category
Technology
-
view
465 -
download
2
Transcript of Designing and developing vocabularies in rdf et
DATASUPPORT
OPEN
Õpimoodul 2.4
RDF sõnastike kujundamine ja arendamine
PwC firms help organisations and individuals create the value they’re looking for. We’re a network of firms in 158 countries with close to 180,000 people who are committed to
delivering quality in assurance, tax and advisory services. Tell us what matters to you and find out more by visiting us at www.pwc.com.
PwC refers to the PwC network and/or one or more of its member firms, each of which is a separate legal entity. Please see www.pwc.com/structure for further details.
DATASUPPORTOPEN
See esitlus on loodud PwC poolt
Autorid: Nikolaos Loutas, Michiel De Keyzer and Stijn Goedertier
Esitluse metaandmed
Slide 2
Avaandmete tugi on rahastatud Euroopa Komisjoni poolt SMART 2012/0107 ‘Lot 2alusel: Teenuste osutamine andmete avaldamiseks, juurdepääsu loomiseks, avalikele andmetele juurdepääsuks ja taaskasutamiseks Euroopa Liidu lõikes läbi olemasolevate avaandmete portaalide (Leping nr. 30-CE-0530965/00-17).
© 2014 Euroopa Komisjon
Täpsustused
1. Esitluses välja toodud seisukohad kuuluvad ainult esitluse koostanud autoritele janeid ei või mitte mingil juhul interpreteerida Euroopa Komisjoni ametlikeseisukohtadena.Euroopa Komisjon ei taga presentatsioonis välja toodud informatsiooni täpsust, ega võtavastutust selle kasutamise eest.Iga viide presentatsioonis spetsiifilisele tootele, täpsustusele, protsessile, teenusele,ärinimele, kaubamärgile või tootjale ei viita Euroopa Komisjoni heakskiidule,soovitustele, ega eelistustele.Autorite poolt on hangitud kõik vajalikud load käsikirjade, illustratsioonide, kaartide jagraafikute kasutamiseks, kui just autor või tema seaduslik esindaja ei oma juba antudintellektuaalse vara kasutusõigust.
2. Esitlus on hoolikalt koostatud PwC poolt, kuid puudub garantii esitluses esitatudinformatsiooni täpsuse ja täielikkuse osas. PwC ei vastuta esitluses esitatudinformatsiooni põhjal tehtud otsuste tagajärgede, ega muu kahju eest. Presentatsioonisesitatud informatsioon on üldist laadi ja mõeldud ainult üldise huvi kohta juhtnöörideandmiseks. Esitlus ei asenda mitte ühegi küsimuse korral antavat professionaalset nõu.Ükski esitluse lugeja ei tohiks langetada otsuseid esitluses sisalduvate andmete põhjalvastava professionaalse nõu küsimiseta.
DATASUPPORTOPEN
Õpieesmärgid
Käesoleva õpimooduli lõpuks peaksid teil olema omandatud järgnevad teadmised:
• Millised on parimad praktikad RDF sõnastiku ning andmemudelite loomiseks.
• Kust leida RDF sõnastikke taaskasutuseks.
• Kuidas luua oma RDF sõnastikku.
• Kuidas avaldada oma RDF sõnastikku.
• Euroopa Komisjoni ISA programmi poolt arendatud semantiliste kokkulepete tegemise protsess ja metodoloogia.
Slide 3
DATASUPPORTOPEN
Sisu
See moodul sisaldab…
• Samme andmemudelite loomiseks.
• Juhiseid kuidas taaskasutada olemasolevaid sõnastikke ja luua andmemudeleid.
• Juhiseid kuidas luua uusi klasse ja omadusi RDF-is.
• Juhiseid kuidas ja kus avaldada oma RDF sõnastikku, et seda oleks teistel võimalik taaskasutada.
Slide 4
DATASUPPORTOPEN
RDF Sõnastik
Slide 5
“Sõnastik on andmemudel, mis koosneb klassidest, omadustest ja seostest, mida on võimalik kasutada andmete ja metaandmetekirjeldamiseks.”
• RDF sõnastikud on terminite komplektid, mida kasutatakse asjade kirjeldamiseks.
• Termin on kas klass või omadus.
Objekt-tüüpi omadused ehk seosed
Andme-tüüpi omadused ehk atribuudid
DATASUPPORTOPEN
Mis on klassid, seosed ja omadused?
Klass. Konstruktsioon, mis esindab asju päris- ja informatsiooni maailmas. Näiteks inimene, organisatsiooni ning kontseptsioonid nagu tervis ja vabadus.
Omadus: seos. Seos kahe klassi vahel; näiteks dokumendi ja selle avaldanud organisatsiooni vahel (organisatsioon avaldab dokumendi), või seos kaardi ja kujuteldava geograafilise regiooni vahel (kaart kujutab geograafilist regiooni). RDF seosed on kodeeritud objekt-tüüpi omadustena.
Omadus: atribuut. Klassi omadus, mille kohta väidame. Näiteksorganisatsiooni ärinimi või kuupäev ja kellaaeg, millal tähelepanek tehti.
Slide 6
DATASUPPORTOPEN
Klassi, atribuudi ja seose näide
Slide 7
http://.../org/2172798119
veebisaithttp://example.com/site
/1234
Registreeritud organisatsioon
Aadress
Dahliastraat 24, 2160 Wommelgem“Nike”
Ametlik aadress
Ärinimi
Klass
Omadus
Seos
DATASUPPORTOPEN
Andmemudelite loomineKuidas taaskasutada andmeid teistest sõnastikest, defineerida oma termineid ning avaldada ja edendada oma sõnastikke andmete kirjeldamiseks.
Slide 8
DATASUPPORTOPEN
6 sammu andmemudelite loomiseni
Alustage valdkonna mudeli arendusega jälgides struktureeritud protsessi ja metodoloogiat.
Analüüsige olemasolevaid termineid ja nende kasutamist, et maksimeerida nende taaskasutamine.
Kui uusi termineid on võimalik vaadelda olemasolevate terminite täpsustustena, looge alamklassid ja alamomadused.
Kui uute terminite loomine on vajalik, looge need jälgides kokkulepitud parimaid praktikaid kasutades.
Avaldage väga stabiilses keskkonnas, mis on püsivana loodud.
Reklaamige RDF skeemi registreerides selle asjakohaste teenustega.
Slide 9
1
Vaata ka:https://joinup.ec.europa.eu/community/semic/document/cookbook-translating-data-models-rdf-schemas
2
3
4
56
DATASUPPORTOPEN
Alustage valdkonna mudeli arendusega
Slide 10
1
class Domain Model
RegisteredOrganisation
- identifier
- name
- registrationDate
- status
- type
Address
- identifier
- fullAddress
- postcode
ContactPoint
- identifier
- name
- telephone
- fax
- website
Activ ity
- identifier
- name
Certificate
- identifier
- name
location
organisationCertificate
contactInformation
organisationActivity
DATASUPPORTOPEN
Kasutage uuesti juba eksisteerivaid termineid ja sõnastikke
• Üldised sõnastikud: DCMI, RDFS
• Asjade nimetamiseks: rdfs:label, foaf:name, skos:prefLabel
• Isikute kirjeldamiseks: FOAF, vCard, Core Person Vocabulary
• Projektide kirjeldamiseks: DOAP, ADMS.SW
• Koosvõimevara kirjeldamiseks: ADMS
• Registreeritud organisatsioonide kirjeldamiseks: Registered Organisation Vocabulary
• Aadressi kirjeldamiseks: vCard, Core Location Vocabulary
• Avalike teenuste kirjeldamiseks: Core Public Service Vocabulary
• Andmekogude kirjeldamiseks: DCAT, DCAT Application Profile, VoID
Slide 11
2
DATASUPPORTOPEN
Rakenduste profiili loomine
• Erinevatel valdkondadel on erinevad nõuded valdkonna spetsiifilistele tähendustele, näiteks klassifitseerimise põhimõtted.
• Üldised RDF sõnastikud annavad tavaliselt kõige põhilisemad klassid, mis on vajalikud laienduste lisamiseks, mis võimaldavad lisada spetsiifilisi alamklassi struktuuri või klassifikatsiooni skeeme.
• Sellistel juhtudel soovitatakse korduvatel kasutajatel defineerida rakenduse profiile rakenduse domeenile lähedaselt täpsustades (vajadusel) alamklasse, alamomadusi ja kontrollitud sõnastikke.
• Näiteks,
DCAT Rakenduse profiil andmeportaalide jaoks Euroopas
Registered Organization vocabulary rakenduse profiilina Organization ontology-le.
Slide 12
Vaata ka:joinup.ec.europa.eu/asset/dcat_application_profile/home
DATASUPPORTOPEN
Taaskasutuse eelised
• Taaskasutus aitab oluliselt kaasa andmete koosvõimele
Kasutades näiteks dcterms:created, siis selle väärtus peaks olema andmed, mis on esitatud kuupäevana, näiteks 2013-02-21^^xsd:date. Sellisena on andmed koheselt töödeldavad mitmete masinate jaoks. Kui teie skeem soovitab andmete avaldajatel kasutada teistsuguseid termineid ja kuupäeva formaate nagu näiteks ex:date "21 February 2013" – vajaksid teie avaldatud andmed täiendavad töötlemist, et muuta need samasuguseks nagu kõik teised andmed.
• Taaskasutus lisab teie skeemile usaldusväärsust.
See näitab, et see on avaldatud hoolikalt ja professionaalselt ning soosib selle taaskasutust.
• Taaskasutus in lihtsam ja odavam.
Klasside ja omaduste taaskasutamine hästi defineeritud ning korralikust sõnastikust aitab ära hoida selle pingutuse uuesti tegemist.
Slide 13
DATASUPPORTOPEN
Võite leida taaskasutatavaid RDF sõnastikke...
Slide 14
http://joinup.ec.europa.eu/
http://lov.okfn.org/
DATASUPPORTOPEN
Alamklasside ja alamomaduste loomine
• RDF skeemid ja sõnastikud hõlmavad tihti termineid, mis on väga üldised.
• Luues alamklasside ja alamomaduste seosed, võivad süsteemid, mis saavad aru superomadustest ja superklassidest tõlgendada andmeid isegi kui spetsiifilisemad terminid on tundmatud.
• Ärge looge alamklasse ja alamomadusi lihtsalt selleks, et kasutada teie oma terminit millekski, mis tegelikult juba eksisteerib.
Slide 15
3
DATASUPPORTOPEN
Alamomaduste loomine – näide
The Registered Organization vocabulary defineerib kolm alamomadust järgnevalt: companyType, companyStatus and companyActivity.
Slide 16
DATASUPPORTOPEN
Alamomaduste defineerimine RDF-is
<rdf:Property rdf:about="rov:companyType">
<rdfs:label xml:lang="en">company type</rdfs:label>
<rdfs:comment xml:lang="en" rdf:parseType="Literal">
This property records the type of company. Familiar types are SA, PLC, LLC, GmbH etc. Each jurisdiction will have a limited set of recognised company types and these should be used in a consistent manner using a skos:Concept as described in the <a href="#skos:Concept">Code</a> Class.
</rdfs:comment>
<rdfs:isDefinedBy rdf:resource="http://www.w3.org/ns/regorg#"/> <rdfs:range rdf:resource="skos:Concept"/>
<rdfs:subPropertyOf rdf:resource="org:classification" /> <dcterms:identifier>legal:companyType</dcterms:identifier>
</rdf:Property>
Slide 17
DATASUPPORTOPEN
Kui uued terminid on vajalikud, looge need kokkulepitud parimaid praktikaid jälgides
Klassid algavad alati suure tähega ning on alati ainsuses: näiteks skos:Concept.
Omadused algavad väikese tähega, näiteks rdfs:label.
Objekt-tüüpi omadused peaksid olema tegusõnad, näiteksorg:hasSite.
Andme-tüüpi omadused peaksid olema nimisõnad, näiteksdcterms:description.
Kasuta uute sõnade alguses suuri tähti kui terminil on rohkem kui üks sõna (camel case), näiteks foaf:isPrimaryTopicOf.
Slide 18
4
DATASUPPORTOPEN
Uue klassi defineerimine - Organisation
<rdf:RDF
xmlns:rdfs=“http://www.w3.org/2000/01/rdf-schema#”
xmlns:org=“htpp://example.org/organisation-schema”>
<rdf:Class rdf:about=“org:Organisation">
<rdfs:label xml:lang="en">Organisation</rdfs:label>
<rdfs:comment xml:lang:”en”>
Legal entity that is registered in an official national or regional register.
</rdfs:comment>
</rdf:Class>
Slide 19
DATASUPPORTOPEN
Uue omaduse defineerimine - registrationNumber
<rdf:RDF
xmlns:rdfs=“http://www.w3.org/2000/01/rdf-schema#”
xmlns:org=“htpp://example.org/organisation-schema”>
<rdf:Property rdf:about=“org:registrationNumber">
<rdfs:label xml:lang="en">registrationNumber</rdfs:label>
<rdfs:comment xml:lang:”en”>
The number that a registered organisation receives upon registration in the official register.
</rdfs:comment>
</rdf:Class>
Slide 20
DATASUPPORTOPEN
Domeeni ja vahemiku piirangute defineerimine
<rdf:RDF
xmlns:rdfs=“http://www.w3.org/2000/01/rdf-schema#”
xmlns:org=“htpp://example.org/organisation-schema”
xmlns:locn=“http://www.w3.org/ns/locn#”>
<rdf:Property rdf:about=“org:isLocated">
<rdfs:label xml:lang="en">isLocated</rdfs:label>
<rdfs:comment xml:lang:”en”>
The official address of the registered organisation’s headquarters.
</rdfs:comment>
<rdfs:domain rdf:resource=“org:Organisation”/>
<rdfs:range rdf:resource=“locn:Address”>
</rdf:Class>
Slide 21
http://example.org/org/1234 org:isLocated http://dbpedia.org/page/Brussels
DATASUPPORTOPEN
Avaldage väga stabiilses keskkonnas, mis on püsivana loodud
• Valige oma RDF skeemi jaoks stabiilne nimi, näiteks (W3C, Purl...)
• Kasutage parimaid praktikaid püsivate Uniform Resource Identifiers (URI) komplektide loomiseks, nii vormingu kui ka disaini ja halduse mõttes.
• Examples:
http://www.w3.org/ns/adms
http://purl.org/dc/elements/1.1
Slide 22
5
Vaata ka:https://joinup.ec.europa.eu/community/semic/document/cookbook-translating-data-models-rdf-schemashttp://www.slideshare.net/OpenDataSupport/design-and-manage-persitent-uris
DATASUPPORTOPEN
Reklaamige RDF skeemi registreerides selle asjakohaste teenustega.
Kui su RDF skeem on avalikustatud, siis on vajalik, et võimalikult palju inimesi selle kohta teaksid. Suurema vaatajaskonna saavutamiseks registreerige see Joinup-is ja Linked Open Vocabularies.
Slide 23
6
Refine the search results via the faceted search filters.
2
1
3
http://joinup.ec.europa.eu
http://lov.okfn.org
DATASUPPORTOPEN
Kokkuvõte
Slide 24
Alustage domeeni mudeli arendusega jälgides struktureeritud protsessi ja metodoloogiat.
Analüüsige olemasolevaid termineid ja nende kasutamist, et maksimeerida nende taaskasutamine.
Kui uusi termineid on võimalik vaadelda olemasolevate terminite täpsustustena, looge alamklassid ja alamomadused.
Kui uute terminite loomine on vajalik, looge need jälgides kokkulepitud parimaid praktikaid kasutades.
Avaldage väga stabiilses keskkonnas, mis on püsivana loodud.
Reklaamige RDF skeemi registreerides selle asjakohaste teenustega.
Analüüsi
Modelleeri
Avalda
DATASUPPORTOPEN
Grupiharjutus ja diskussioon
Slide 25
Moodustage kahestes gruppides RDF-i sõnastiku kirjeldus, mis esindab elanikku.
Mis on teie arvates peamised barjäärid, mis takistavad olemasolevat RDF sõnastiku taaskasutamist?
http://www.visualpharm.com
http://www.visualpharm.com
Internetiküsitluse leiad siit!
DATASUPPORTOPEN
Tänan kuulamast...küsimusi?
Slide 26
DATASUPPORTOPEN
Viited
Slaid 9:
• Linked Data Cookbook. W3C. http://www.w3.org/2011/gld/wiki/Linked_Data_Cookbook
Slaidid 10-23:
• ISA Programme. Cookbook for translating Data Models to RDF Schemas. https://joinup.ec.europa.eu/community/semic/document/cookbook-translating-data-models-rdf-schemas
Slaidid 16, 18,-21:
• W3C. An organization ontology. http://www.w3.org/TR/vocab-org/
Slaid 23:
• ADMS Brochure. ISA Programme. https://joinup.ec.europa.eu/elibrary/document/adms-brochure
Slide 27
DATASUPPORTOPEN
Täiendavat lugemist
Linked Data Cookbook, W3C Government Linked Data Working Group,
http://www.w3.org/2011/gld/wiki/Linked_Data_Cookbook
EC, ISA Process and methodology for developing semantic agreements, https://joinup.ec.europa.eu/community/core_vocabularies/document/process-and-methodology-developing-semantic-agreements
EC ISA, Cookbook for translating Data Models to RDF Schemas https://joinup.ec.europa.eu/community/semic/document/cookbook-translating-data-models-rdf-schemas
Slide 28
DATASUPPORTOPEN
Seotud projektid ja algatused
Joinup, http://joinup.ec.europa.eu
Linked Open Vocabularies (LOV), http://lov.okfn.org/
EC ISA, e-Government Core Vocabularies,https://joinup.ec.europa.eu/community/core_vocabularies/home
W3C Schools – Learn RDF http://www.w3schools.com/rdf/default.asp
EUCLID, http://euclid-project.eu/
XML Summer School http://xmlsummerschool.com/
Slide 29
DATASUPPORTOPEN
Ole osa meie meeskonnast...
Leia meid
Kontakt
Liitu meiega
Jälgi meid
Open Data Supporthttp://www.slideshare.net/OpenDataSupport
http://www.opendatasupport.euOpen Data Supporthttp://goo.gl/y9ZZI
@OpenDataSupport [email protected]
Slide 30