“ Go to the conceptual level such to become independent of the technology”
description
Transcript of “ Go to the conceptual level such to become independent of the technology”
The semantic path :The semantic path :from file to profiles from file to profiles
De la représentation De la représentation de l’information à celle de la connaissance de l’information à celle de la connaissance
Roger Roberts - RTBF/Titan
““Go to the conceptual level such to become independent of the technology” Go to the conceptual level such to become independent of the technology”
Recommendation of M. Rob SHARPERecommendation of M. Rob SHARPE
The semantic path :The semantic path :from file to profilesfrom file to profiles
De la conscience à la communication : De la conscience à la communication : La langue comme outil d’indexation (Jacques Derrida)La langue comme outil d’indexation (Jacques Derrida) Un peu de linguistique : signifiant/signifié (Ferdinand de Saussure) - contexteUn peu de linguistique : signifiant/signifié (Ferdinand de Saussure) - contexte
Représentation de l’information :Représentation de l’information : Naissance de la presse écriteNaissance de la presse écrite Les grands media du 20Les grands media du 20èmeème siècle : de l’audio à la vidéo siècle : de l’audio à la vidéo L’Internet : media du 21L’Internet : media du 21èmeème siècle siècle
Les langages pour écrire, afficher, stocker et consulter dans un Les langages pour écrire, afficher, stocker et consulter dans un univers multimédia interactif :univers multimédia interactif :
Le HTML : Hyper Text Mark-up LanguageLe HTML : Hyper Text Mark-up Language Le XML : eXchange Mark-up LanguageLe XML : eXchange Mark-up Language
La Structuration de l’information (langage machine) :La Structuration de l’information (langage machine) : RDF (Resource Description Framework), OWL (Ontology Web Language), SKOS RDF (Resource Description Framework), OWL (Ontology Web Language), SKOS
(Simple Knowledge Organisation System)(Simple Knowledge Organisation System) Les ontologies (FRBR – CRM)Les ontologies (FRBR – CRM)
AXIS (AXIS (Acquisition, eXchange, Indexation, Structuration) - TitanAcquisition, eXchange, Indexation, Structuration) - Titan
Références & RemerciementsRéférences & Remerciements
The semantic path :The semantic path :from file to profilesfrom file to profiles
De la conscience à la communication : De la conscience à la communication : La langue comme outil d’indexation (Jacques Derrida)La langue comme outil d’indexation (Jacques Derrida) Un peu de linguistique : signifiant/signifié (Ferdinand de Saussure) - contexteUn peu de linguistique : signifiant/signifié (Ferdinand de Saussure) - contexte
Représentation de l’information :Représentation de l’information : Naissance de la presse écriteNaissance de la presse écrite Les grands media du 20Les grands media du 20èmeème siècle : de l’audio à la vidéo siècle : de l’audio à la vidéo L’Internet : media du 21L’Internet : media du 21èmeème siècle siècle
Les langages pour écrire, afficher, stocker et consulter dans un Les langages pour écrire, afficher, stocker et consulter dans un univers multimédia interactif :univers multimédia interactif :
Le HTML : Hyper Text Mark-up LanguageLe HTML : Hyper Text Mark-up Language Le XML : eXchange Mark-up LanguageLe XML : eXchange Mark-up Language
La Structuration de l’information (langage machine) :La Structuration de l’information (langage machine) : RDF (Resource Description Framework), OWL (Ontology Web Language), SKOS RDF (Resource Description Framework), OWL (Ontology Web Language), SKOS
(Simple Knowledge Organisation System)(Simple Knowledge Organisation System) Les ontologies (FRBR – CRM)Les ontologies (FRBR – CRM)
AXIS (AXIS (Acquisition, eXchange, Indexation, Structuration) - TitanAcquisition, eXchange, Indexation, Structuration) - Titan
Références & RemerciementsRéférences & Remerciements
Notre univers est géré au niveau sémantique : conscience – connaissance - culture :
Symboles, langages…….
Sculpture
Audiovisuel
Vue
Musique
Photographie
Peinture
Architecture
Goût
Odorat
Toucher
Ouïe
LanguesLangues(syntaxe)(syntaxe)
Ecrit Parlé
Graphisme
Arts du vivant
Conscience
Connaissance
The semantic path :The semantic path :from file to profilesfrom file to profiles
De la conscience à la communication : De la conscience à la communication : La langue comme outil d’indexation (Jacques Derrida)La langue comme outil d’indexation (Jacques Derrida) Un peu de linguistique : signifiant/signifié (Ferdinand de Saussure) - contexteUn peu de linguistique : signifiant/signifié (Ferdinand de Saussure) - contexte
Représentation de l’information :Représentation de l’information : Naissance de la presse écriteNaissance de la presse écrite Les grands media du 20Les grands media du 20èmeème siècle : de l’audio à la vidéo siècle : de l’audio à la vidéo L’Internet : media du 21L’Internet : media du 21èmeème siècle siècle
Les langages pour écrire, afficher, stocker et consulter dans un Les langages pour écrire, afficher, stocker et consulter dans un univers multimédia interactif :univers multimédia interactif :
Le HTML : Hyper Text Mark-up LanguageLe HTML : Hyper Text Mark-up Language Le XML : eXchange Mark-up LanguageLe XML : eXchange Mark-up Language
La Structuration de l’information (langage machine) :La Structuration de l’information (langage machine) : RDF (Resource Description Framework), OWL (Ontology Web Language), SKOS RDF (Resource Description Framework), OWL (Ontology Web Language), SKOS
(Simple Knowledge Organisation System)(Simple Knowledge Organisation System) Les ontologies (FRBR – CRM)Les ontologies (FRBR – CRM)
AXIS (AXIS (Acquisition, eXchange, Indexation, Structuration) - TitanAcquisition, eXchange, Indexation, Structuration) - Titan
Références & RemerciementsRéférences & Remerciements
Traité de linguistique généraleTraité de linguistique généraleFerdinand de Saussure (1917)Ferdinand de Saussure (1917)
SignifiéSignifiant
Date :Année/Mois/Jour
2001/09/11
SignifiéSignifiant
European Bhuddist UnionEuropean Boxing Union
European Broadcast UnionEuropean Barge Union
European Badminton UnionEnglish Bridge Union
European Blind Union European Board of Urology
…..
EBU
« Protocole Gutenberg » :Certains moteurs de recherche travaillent uniquement
sur le signifiant et le « pooling » :Résultat : une avalanche de résultats polysémiques !!!!!
Carences de l’univers audiovisuel numérique Carences de l’univers audiovisuel numérique sémantique actuel : l’absence du contextesémantique actuel : l’absence du contexte
The semantic path :The semantic path :from file to profilesfrom file to profiles
De la conscience à la communication : De la conscience à la communication : La langue comme outil d’indexation (Jacques Derrida)La langue comme outil d’indexation (Jacques Derrida) Un peu de linguistique : signifiant/signifié (Ferdinand de Saussure) - contexteUn peu de linguistique : signifiant/signifié (Ferdinand de Saussure) - contexte
Représentation de l’information :Représentation de l’information : Naissance de la presse écriteNaissance de la presse écrite Les grands media du 20Les grands media du 20èmeème siècle : de l’audio à la vidéo siècle : de l’audio à la vidéo L’Internet : media du 21L’Internet : media du 21èmeème siècle siècle
Les langages pour écrire, afficher, stocker et consulter dans un Les langages pour écrire, afficher, stocker et consulter dans un univers multimédia interactif :univers multimédia interactif :
Le HTML : Hyper Text Mark-up LanguageLe HTML : Hyper Text Mark-up Language Le XML : eXchange Mark-up LanguageLe XML : eXchange Mark-up Language
La Structuration de l’information (langage machine) :La Structuration de l’information (langage machine) : RDF (Resource Description Framework), OWL (Ontology Web Language), SKOS RDF (Resource Description Framework), OWL (Ontology Web Language), SKOS
(Simple Knowledge Object System)(Simple Knowledge Object System) Les ontologies (FRBR – CRM)Les ontologies (FRBR – CRM)
AXIS (AXIS (Acquisition, eXchange, Indexation, Structuration) - TitanAcquisition, eXchange, Indexation, Structuration) - Titan
Références & RemerciementsRéférences & Remerciements
Naissance de la presse écrite moderne : Naissance de la presse écrite moderne : début du 17début du 17èmeème siècle ! siècle !
Le 31 Mai 1631, Théophraste Renaudot lance :
«La Gazette».
http://www.museerenaudot.com/imprim.htm
The semantic path :The semantic path :from file to profilesfrom file to profiles
De la conscience à la communication : De la conscience à la communication : La langue comme outil d’indexation (Jacques Derrida)La langue comme outil d’indexation (Jacques Derrida) Un peu de linguistique : signifiant/signifié (Ferdinand de Saussure) - contexteUn peu de linguistique : signifiant/signifié (Ferdinand de Saussure) - contexte
Représentation de l’information :Représentation de l’information : Naissance de la presse écriteNaissance de la presse écrite Les grands media du 20Les grands media du 20èmeème siècle : de l’audio à la vidéo siècle : de l’audio à la vidéo L’Internet : media du 21L’Internet : media du 21èmeème siècle siècle
Les langages pour écrire, afficher, stocker et consulter dans un Les langages pour écrire, afficher, stocker et consulter dans un univers multimédia interactif :univers multimédia interactif :
Le HTML : Hyper Text Mark-up LanguageLe HTML : Hyper Text Mark-up Language Le XML : eXchange Mark-up LanguageLe XML : eXchange Mark-up Language
La Structuration de l’information (langage machine) :La Structuration de l’information (langage machine) : RDF (Resource Description Framework), OWL (Ontology Web Language), SKOS RDF (Resource Description Framework), OWL (Ontology Web Language), SKOS
(Simple Knowledge Organisation System)(Simple Knowledge Organisation System) Les ontologies (FRBR – CRM)Les ontologies (FRBR – CRM)
AXIS (AXIS (Acquisition, eXchange, Indexation, Structuration) - TitanAcquisition, eXchange, Indexation, Structuration) - Titan
Références & RemerciementsRéférences & Remerciements
Naissance de la radio : Naissance de la radio : début du 20début du 20èmeème siècle ! siècle !
Naissance de la télévision : Naissance de la télévision : milieu du 20milieu du 20èmeème siècle ! siècle !
Since the very beginning, RTBF covered a wide range of events in Belgium, in any field (news, entertainment, music, History, cultural and scientific magazines, documentaries, sports, etc.) but also outside Belgium, and mainly in central Africa. It
currently holds more than 100.000 hours of programming, and of course the catalogue is growing every day.
Historique de l’Audiovisuel :Historique de l’Audiovisuel :des enregistrements sur un support physique !des enregistrements sur un support physique !
Å dîale li Hardwåre, Nanesse, avou
s’tchèrète di Betacam Gini !
Vîve li Vapeurwåre qui d’vint l’vrèye !
1515
DIF(DV, DVCAM, DVCPRO) FileDIF(DV, DVCAM, DVCPRO) FileAVI File AVI File (type 1DV, type2DV, Canopus DV, Matrox AVI-DV, Microsoft AVI…)(type 1DV, type2DV, Canopus DV, Matrox AVI-DV, Microsoft AVI…)
QuickTime Apple, QuickTime AvidQuickTime Apple, QuickTime AvidWindows MediaWindows MediaReal VideoReal VideoMPEG-1 (VCD)MPEG-1 (VCD)MPEG-2 (SVCD – DVD) MPEG-2 (SVCD – DVD) MPEG-2 (Long GOP)MPEG-2 (Long GOP)MPEG-2 (I-Frame) IMXMPEG-2 (I-Frame) IMXMPEG-4MPEG-4Avid OMF 1 et 2 (AVR, MJPEG…)Avid OMF 1 et 2 (AVR, MJPEG…)Avid OMF-DVAvid OMF-DVDivXDivXWAV – BWFWAV – BWFAIFF (AIFF (AAudio udio IInterchange nterchange FFile ile FFormat)ormat)
Formats fichiers Audio/VidéoFormats fichiers Audio/Vidéo
The semantic path :The semantic path :from file to profilesfrom file to profiles
De la conscience à la communication : De la conscience à la communication : La langue comme outil d’indexation (Jacques Derrida)La langue comme outil d’indexation (Jacques Derrida) Un peu de linguistique : signifiant/signifié (Ferdinand de Saussure) - contexteUn peu de linguistique : signifiant/signifié (Ferdinand de Saussure) - contexte
Représentation de l’information :Représentation de l’information : Naissance de la presse écriteNaissance de la presse écrite Les grands media du 20Les grands media du 20èmeème siècle : de l’audio à la vidéo siècle : de l’audio à la vidéo L’Internet : media du 21L’Internet : media du 21èmeème siècle siècle
Les langages pour écrire, afficher, stocker et consulter dans un Les langages pour écrire, afficher, stocker et consulter dans un univers multimédia interactif :univers multimédia interactif :
Le HTML : Hyper Text Mark-up LanguageLe HTML : Hyper Text Mark-up Language Le XML : eXchange Mark-up LanguageLe XML : eXchange Mark-up Language
La Structuration de l’information (langage machine) :La Structuration de l’information (langage machine) : RDF (Resource Description Framework), OWL (Ontology Web Language), SKOS RDF (Resource Description Framework), OWL (Ontology Web Language), SKOS
(Simple Knowledge Organisation System)(Simple Knowledge Organisation System) Les ontologies (FRBR – CRM)Les ontologies (FRBR – CRM)
AXIS (AXIS (Acquisition, eXchange, Indexation, Structuration) - TitanAcquisition, eXchange, Indexation, Structuration) - Titan
Références & RemerciementsRéférences & Remerciements
Naissance de l’Internet : Naissance de l’Internet : fin du 20fin du 20èmeème siècle ! siècle !
Le réseau comme relation Le réseau comme relation entre l’individu et le mondeentre l’individu et le monde
Evolution de l’InternetEvolution de l’Internetdu web 1.0 au Web 4.0 :du web 1.0 au Web 4.0 :
Carences technologiques Carences technologiques de l’univers audiovisuel numérique actuel :de l’univers audiovisuel numérique actuel :
Principaux problèmes des technologies de l’information :Principaux problèmes des technologies de l’information :
Les systèmes informatiques «propriétaires»Les systèmes informatiques «propriétaires» Le fichier n’est pas une entité facile à manipuler (diffusion en direct, Le fichier n’est pas une entité facile à manipuler (diffusion en direct,
héritage de l’indexation lors de la création de versions ou copies, volume de héritage de l’indexation lors de la création de versions ou copies, volume de stockage, …)stockage, …)
Les techniques d’indexation ont les limites du langage naturelLes techniques d’indexation ont les limites du langage naturel Le sens du contenu n'est pas accessible par la machine .. Il y a une Le sens du contenu n'est pas accessible par la machine .. Il y a une
absence absence de sémantique (processus au niveau de la syntaxe)de sémantique (processus au niveau de la syntaxe) Problèmes liés aux moteurs de recherche à mots-clésProblèmes liés aux moteurs de recherche à mots-clés (g(grand volume d'extraction, faible précisionrand volume d'extraction, faible précision ou ou faible extraction faible extraction ou absence d'extractionou absence d'extraction, , résultats très sensibles au vocabulaire, intervention résultats très sensibles au vocabulaire, intervention
humaine nécessaire pour l'interprétation et la combinaison des résultats)humaine nécessaire pour l'interprétation et la combinaison des résultats)
Approche nouvelle (sémantique) : Approche nouvelle (sémantique) :
Représenter le contenu sous une forme plus facilement traitable par la Représenter le contenu sous une forme plus facilement traitable par la machine (wrapper = conteneur encapsulant les fichiers)machine (wrapper = conteneur encapsulant les fichiers)
Utiliser les techniques d'intelligence artificielle pour tirer profit de ces Utiliser les techniques d'intelligence artificielle pour tirer profit de ces représentationsreprésentations
Segmentation d’un objet audiovisuelSegmentation d’un objet audiovisuelstockage et relations entre les élémentsstockage et relations entre les éléments
Programme - SujetProgramme - Sujet
P-titreP-titre P-AuteurP-Auteurindexindex
Segment 1Segment 1
I-titre 1I-titre 1 Item 1Item 1
S-titre 1S-titre 1
audioaudio videovideo
Segment 2Segment 2
I-titre 2I-titre 2 Item 2Item 2
S-titre 2S-titre 2
audioaudio videovideo
Stockage limité, peu de relationsStockage limité, peu de relations
Stockage faible, beaucoup de relations
Stockage élevé, peu de relations
The semantic path :The semantic path :from file to profilesfrom file to profiles
De la conscience à la communication : De la conscience à la communication : La langue comme outil d’indexation (Jacques Derrida)La langue comme outil d’indexation (Jacques Derrida) Un peu de linguistique : signifiant/signifié (Ferdinand de Saussure) - contexteUn peu de linguistique : signifiant/signifié (Ferdinand de Saussure) - contexte
Représentation de l’information :Représentation de l’information : Naissance de la presse écriteNaissance de la presse écrite Les grands media du 20Les grands media du 20èmeème siècle : de l’audio à la vidéo siècle : de l’audio à la vidéo L’Internet : media du 21L’Internet : media du 21èmeème siècle siècle
Les langages pour écrire, afficher, stocker et consulter dans un Les langages pour écrire, afficher, stocker et consulter dans un univers multimédia interactif :univers multimédia interactif :
Le HTML : Hyper Text Mark-up LanguageLe HTML : Hyper Text Mark-up Language Le XML : eXchange Mark-up LanguageLe XML : eXchange Mark-up Language
La Structuration de l’information (langage machine) :La Structuration de l’information (langage machine) : RDF (Resource Description Framework), OWL (Ontology Web Language), SKOS RDF (Resource Description Framework), OWL (Ontology Web Language), SKOS
(Simple Knowledge Organisation System)(Simple Knowledge Organisation System) Les ontologies (FRBR – CRM)Les ontologies (FRBR – CRM)
AXIS (AXIS (Acquisition, eXchange, Indexation, Structuration) - TitanAcquisition, eXchange, Indexation, Structuration) - Titan
Références & RemerciementsRéférences & Remerciements
H.T.M.L.Hyper Text Mark-up Language
X.M.L.eXtensible Mark-up Language
X.S.D.Schema
X.S.L.eXtensible Style Language
SGML – HTML – XML- XSD – XSL - XLSTMark-up Languages : les langages à balises
S.G.M.L.Generalized Mark-up Language
Principes d’un codage dans un langage à balises :
<….> : Ouvrir - Open
</….> : Fin - End
Une balise : < ………> </……..> : Mark-up languageUne balise : < ………> </……..> : Mark-up language
Hyper text Markup language := «Johannes Gutenberg» informatique
Le HTML (Hypertext Markup Language) est un set de tags (langage à balise ou code) inseré dans un fichier en vue d’un affichage d’une page graphique par un navigateur (comme les caractères typographiques dans Word pour la mise en page et l’impression papier).
Le tag indique à l’éditeur (browser) comment réaliser la mise en forme des textes et des images d’une page au format HTML (emplacement, type de cartouche, taille du caractère, couleur du caractère, lien interactif avec un objet, une image, un site web, …) pour un écran Pc, un écran Tv, une page A4, un PDA, un écran GSM, …. !
Ces tags sont formulés par paire afin d’indiquer le moment de début <…>et de fin </…> de chaque élément de la page.
Exemple de codage en HTML :
<HTML> : : OOuvrir un documentuvrir un document HTML HTML
<HEAD> : : En-têteEn-tête - Head (emplacement, …). - Head (emplacement, …).
<TITLE> : : LLe titre e titre : : «« FIL - TalnFIL - Taln» » </TITLE> : : fin titrefin titre
</HEAD> : : FFin in en-têteen-tête
<BODY> : Simsun 24 Gras Italique : Simsun 24 Gras Italique </BODY> : Police, style, taille
</HTML> : : F Fin du documenin du document HTMLt HTML
The semantic path :The semantic path :from file to profilesfrom file to profiles
De la conscience à la communication : De la conscience à la communication : La langue comme outil d’indexation (Jacques Derrida)La langue comme outil d’indexation (Jacques Derrida) Un peu de linguistique : signifiant/signifié (Ferdinand de Saussure) - contexteUn peu de linguistique : signifiant/signifié (Ferdinand de Saussure) - contexte
Représentation de l’information :Représentation de l’information : Naissance de la presse écriteNaissance de la presse écrite Les grands media du 20Les grands media du 20èmeème siècle : de l’audio à la vidéo siècle : de l’audio à la vidéo L’Internet : media du 21L’Internet : media du 21èmeème siècle siècle
Les langages pour écrire, afficher, stocker et consulter dans un Les langages pour écrire, afficher, stocker et consulter dans un univers multimédia interactif :univers multimédia interactif :
Le HTML : Hyper Text Mark-up LanguageLe HTML : Hyper Text Mark-up Language Le XML : eXchange Mark-up LanguageLe XML : eXchange Mark-up Language
La Structuration de l’information (langage machine) :La Structuration de l’information (langage machine) : RDF (Resource Description Framework), OWL (Ontology Web Language), SKOS RDF (Resource Description Framework), OWL (Ontology Web Language), SKOS
(Simple Knowledge Object System)(Simple Knowledge Object System) Les ontologies (FRBR – CRM)Les ontologies (FRBR – CRM)
AXIS (AXIS (Acquisition, eXchange, Indexation, Structuration) - TitanAcquisition, eXchange, Indexation, Structuration) - Titan
Références & RemerciementsRéférences & Remerciements
eXtensible Markup Language = langage structuré pour décrire des métadonnées
Le XML (Extensible Mark up Language) est un langage structuré, un outil destiné à gérer d’un façon simple à la fois les formats et les données d’une information diffusée au travers du World Wide Web sans le recours à une Base de Données Ce langage structuré offre aux utilisateurs la possibilité d’encoder des données ou d’émettre une requête auprès de serveurs WEB afin de recueillir des informations validées et utiles ! Le XML peut être facilement mis en oeuvre par des individus ou des sociétés qui souhaitent partager ou échanger de l’information. Les éditeurs multimédia ont adopté des schémas génériques XSD-XML pour décrire l’indexation des données de sites WEB cross media (image, video, son, texte, langues) : c’est le premier niveau du web sémantique.
Exemple de codage en XML
<MEMBRE TYPE= "IR" ID="M01"> <LOGIN ID= «Cental> <NOM> Fairon </NOM> <PRENOM> Cédrick </PRENOM> <MEL> [email protected] [email protected] </MEL> <TEL> +32 10 47 37 88 </TEL> <FAX> +32 10 47 26 06 </FAX> <Société> U C L </Société> <<CentalCental>></ </ Area 420 >> </MEMBRE>
XSL / XSLT: Extensible Stylesheet Language Transformation :
XSLTXSLT est l'abréviation de Extensible Stylesheet Language Transformation. est l'abréviation de Extensible Stylesheet Language Transformation. C'est un langage de programmation quiC'est un langage de programmation qui sert à transformer des documents sert à transformer des documents XML dans divers formats comme le HTML et ... le XML)XML dans divers formats comme le HTML et ... le XML)
XSLT XSLT possède de nombreuses fonctions de traitement qui en font un possède de nombreuses fonctions de traitement qui en font un langage de programmation complet. On peutlangage de programmation complet. On peut créer des "fonctions", des créer des "fonctions", des boucles, calculer un maximum, faire des recherches dans un document XML, boucles, calculer un maximum, faire des recherches dans un document XML, compter lecompter le nombre de résultats, etc.nombre de résultats, etc.
XSLT XSLT est avant tout orienté vers le traitement d'un fichier XML. On va est avant tout orienté vers le traitement d'un fichier XML. On va appliquer desappliquer des modèles (templates) sur les balises XML, puis leur appliquer modèles (templates) sur les balises XML, puis leur appliquer des traitements divers.des traitements divers.
Exemple : source XMLExemple : source XML Exemple : template XSLExemple : template XSL Résultat dans le browserRésultat dans le browser
Exemple impression papier XML en XSLT !!!!Exemple impression papier XML en XSLT !!!!
The semantic path :The semantic path :from file to profilesfrom file to profiles
De la conscience à la communication : De la conscience à la communication : La langue comme outil d’indexation (Jacques Derrida)La langue comme outil d’indexation (Jacques Derrida) Un peu de linguistique : signifiant/signifié (Ferdinand de Saussure) - contexteUn peu de linguistique : signifiant/signifié (Ferdinand de Saussure) - contexte
Représentation de l’information :Représentation de l’information : Naissance de la presse écriteNaissance de la presse écrite Les grands media du 20Les grands media du 20èmeème siècle : de l’audio à la vidéo siècle : de l’audio à la vidéo L’Internet : media du 21L’Internet : media du 21èmeème siècle siècle
Les langages pour écrire, afficher, stocker et consulter dans un Les langages pour écrire, afficher, stocker et consulter dans un univers multimédia interactif :univers multimédia interactif :
Le HTML : Hyper Text Mark-up LanguageLe HTML : Hyper Text Mark-up Language Le XML : eXchange Mark-up LanguageLe XML : eXchange Mark-up Language
La Structuration de l’information (langage machine) :La Structuration de l’information (langage machine) : RDF (Resource Description Framework), OWL (Ontology Web Language), SKOS RDF (Resource Description Framework), OWL (Ontology Web Language), SKOS
(Simple Knowledge Organisation System)(Simple Knowledge Organisation System) Les ontologies (FRBR – CRM)Les ontologies (FRBR – CRM)
AXIS (AXIS (Acquisition, eXchange, Indexation, Structuration) - TitanAcquisition, eXchange, Indexation, Structuration) - Titan
Références & RemerciementsRéférences & Remerciements
SémantiqueSémantique
Un objet «information» numérique : Un objet «information» numérique : les relations entre données et la sémantiqueles relations entre données et la sémantique
11100110111010100110011010101101010101011010101010100110101111001101110101001100110101011010101010110101010101001101010011001100110110101010101111101010101000100101110110100110000110011001101101010101011111010101010001001011101101001100101010110110010100110010101010011010101001101110110110011001010101101100101001100101010100110101010011011101101100110010010001010101010101011001101011010100101101010101011001110100100010101010101010110011010110101001011010101010110011101010101100101010101011011000010101010101011010101010101010110101011001010101010110110000101010101010110101010101010101101101000110101111011010111101110100101011010101010101100101011010001101011110110101111011101001010110101010101011001010101001010110101001101101011010111010011000111010101101011101010010101101010011011010110101110100110001110101011010110011001010110011010110101011011011001010011001010110010101100110010101100110101101010110110110010100110010101100101011001100110101011001101011010110101100110101101010101010000110011001101010110011010110101101011001101011010101010100001101011010110110101001001010101010101000110110001101001010110010110101101101010010010101010101010001101100011010010101101100011001101010110101101010110101110010101100111001100101011000110011010101101011010101101011100101011001110011001010100110011010101010110101010011001101101100101110010101001111001100110101010101101010100110011011011001011100101010011101010101001110011011101010011001101010110101010101101010101010101010011100110111010100110011010101101010101011010101010100110101001100110011011010101010111110101010100010010111001001101010011001100110110101010101111101010101000100101110110100110010101011011001010011001010101001101010100110111011101001100101010110110010100110010101010011010101001101110110110011001001000101010101010101100110101101010010110101010101100110010010001010101010101011001101011010100101101010101011001110101010110010101010101101100001010101010101101010110110011101010101100101010101011011000010101010101011010101010101010110110100011010010101010110110100011010
OntologieOntologie
MétadonnéesMétadonnées
HTML
HTML
XML
XML
M
A
C
H
I
N
E
M
A
C
H
I
N
E
HUMAIN
HUMAIN
RDF/OWL
Logique
FRBR/CRM
H.T.M.L.Hyper Text Mark-up Language
X.M.L.eXtensible Mark-up Language
SGML – RDF - OWLles méta-langages sémantiques
S.G.M.L.Generalized Mark-up Language
RDF (Resource Description Framework) est un RDF (Resource Description Framework) est un meta langage pour exprimer des déclarations entre meta langage pour exprimer des déclarations entre une ressource et une propriété :une ressource et une propriété :
<rdf:RDF xmlns<rdf:RDF xmlns::rdfrdf=« … » =« … » xmlnsxmlns::myfamilymyfamily==« … »« … »>>
<rdf:Description <rdf:Description rdf:about="http://www.family.roberts/mathieu">rdf:about="http://www.family.roberts/mathieu">
<family:father>Roger Roberts</family:father><family:father>Roger Roberts</family:father>
</rdf:Description></rdf:Description>
</rdf:RDF></rdf:RDF>
Architecture Web SemanticArchitecture Web Semanticla couche RDF la couche RDF
Resource :Mathieu
Property:Roger
Father
Exprimer dans un langage que le père de P est Y (P,Y)
Population universitaire
Personnel Etudiants
Personnel académique
Personnel administratif
Personnel technique
Etudesen cours
Postgradués
Permanent Chercheur Visiteur
Exemple d’une “Class Hierarchy”Exemple d’une “Class Hierarchy”
Architecture Web Semantic Architecture Web Semantic la couche ontologiquela couche ontologique
En RDF, il est impossible d’établir des relations entre En RDF, il est impossible d’établir des relations entre différentes déclarations. Pour ce faire, on utilise un méta différentes déclarations. Pour ce faire, on utilise un méta langage : OWL (Ontology Web Language)langage : OWL (Ontology Web Language)
<owl:ObjectProperty rdf:ID=“Parent"><owl:ObjectProperty rdf:ID=“Parent">
<rdfs:range rdf:resource="#human"/><rdfs:range rdf:resource="#human"/>
<rdfs:domain rdf:resource= "#family"/><rdfs:domain rdf:resource= "#family"/>
<owl:inverseOf rdf:resource="#Child"/><owl:inverseOf rdf:resource="#Child"/>
</owl:ObjectProperty></owl:ObjectProperty>
Avec cette déclaration, le système informatique peut Avec cette déclaration, le système informatique peut déduire que si Roger est le père de Mathieu, le fils de déduire que si Roger est le père de Mathieu, le fils de Roger est Mathieu !Roger est Mathieu !
« Héhé … !!! ;-) »« Héhé … !!! ;-) »
Ressource:Statement
Parent(P,X)
Property:Statement Child(P,X)
InverseOf
Rules reminder: Rules reminder: R1: male(X), parent(P,X) R1: male(X), parent(P,X) father(P,X) father(P,X) R2: father(P,X),parent(P,Y),notSame(X,Y) R2: father(P,X),parent(P,Y),notSame(X,Y) mother(P,Y) mother(P,Y)R3: parent(P,X),brotherOrSister(P,Q) R3: parent(P,X),brotherOrSister(P,Q) parent(Q,X) parent(Q,X)R4: genBrotherOrSister(P,Q) R4: genBrotherOrSister(P,Q) genBrotherOrSister(Q,P) genBrotherOrSister(Q,P)
If we assert to the system:If we assert to the system:Parent(Arthur,Olivier)Parent(Arthur,Olivier)Male(Olivier)Male(Olivier)genBrotherOrSister(Arthur, Leonard)genBrotherOrSister(Arthur, Leonard)Parent(Leonard,Celine)Parent(Leonard,Celine)
Using rules, the system can deduce thatUsing rules, the system can deduce that
R1: male(Olivier), parent(Arthur,Olivier) R1: male(Olivier), parent(Arthur,Olivier) R4: genBrotherOrSister(Arthur,Leonard) R4: genBrotherOrSister(Arthur,Leonard) R3:Parent(Leonard,Celine),R3:Parent(Leonard,Celine),
genBrotherOrSister(Leonard, Arthur)genBrotherOrSister(Leonard, Arthur)R2:father(Arthur,Olivier),parent(Arthur,Celine),R2:father(Arthur,Olivier),parent(Arthur,Celine),
notSame(Celine,Olivier)notSame(Celine,Olivier)
Father(Arthur,Olivier)Father(Arthur,Olivier) genBrotherOrSister(Leonard, Arthur)genBrotherOrSister(Leonard, Arthur)
Parent(Arthur,Celine)Parent(Arthur,Celine)
Mother(Arthur,Celine)Mother(Arthur,Celine)
Un exemple d’ Inference Un exemple d’ Inference
Web Semantic Architecture
Unicode : a comprehension of encoding on every computers.
URI : Universal Resource Identifier (identify a resource)
XML permits abstracts expressions, sharable between different computers in different locations.
NS : Name Space and schemas which (define a set of vocabulary)
RDF (Resource Description Framework) is a way to express a statement between a ressource and a property
OWL allow us to declare some refined relationship between statement and properties (Inverse, equivalent, restrictions, …)
The process of asserting statements and rules, then starting a step of inducing and deducing new assertions
In a context of web analysis, this is a way to prepare data for the future
RDF
XML + Name Space + xmlschema
Unicode U.R.I.
RDFS
Ontology vocabulary
Proof
Logic
HTML
Métalangage, organisation des connaissances à l’aide du langage RDF
Fort proche de OWL, SKOS attribue 4 propriétés afin de spécifier un concept de base :
•Propriété identifiante•Propriété descriptive•Propriété structurante•Propriété englobante
C’est un outil particulièrement bien adapté pour décrire des alias ou pour construire des objets multilingues.
Métalangage, organisation des connaissances à l’aide du langage RDF
Fort proche de OWL, SKOS attribue 4 propriétés afin de spécifier un concept de base :
•Propriété identifiante•Propriété descriptive•Propriété structurante•Propriété englobante
C’est un outil particulièrement bien adapté pour décrire des alias ou pour construire des objets multilingues.
The semantic path :The semantic path :from file to profilesfrom file to profiles
De la conscience à la communication : De la conscience à la communication : La langue comme outil d’indexation (Jacques Derrida)La langue comme outil d’indexation (Jacques Derrida) Un peu de linguistique : signifiant/signifié (Ferdinand de Saussure) - contexteUn peu de linguistique : signifiant/signifié (Ferdinand de Saussure) - contexte
Représentation de l’information :Représentation de l’information : Naissance de la presse écriteNaissance de la presse écrite Les grands media du 20Les grands media du 20èmeème siècle : de l’audio à la vidéo siècle : de l’audio à la vidéo L’Internet : media du 21L’Internet : media du 21èmeème siècle siècle
Les langages pour écrire, afficher, stocker et consulter dans un Les langages pour écrire, afficher, stocker et consulter dans un univers multimédia interactif :univers multimédia interactif :
Le HTML : Hyper Text Mark-up LanguageLe HTML : Hyper Text Mark-up Language Le XML : eXchange Mark-up LanguageLe XML : eXchange Mark-up Language
La Structuration de l’information (langage machine) :La Structuration de l’information (langage machine) : RDF (Resource Description Framework), OWL (Ontology Web Language), SKOS RDF (Resource Description Framework), OWL (Ontology Web Language), SKOS
(Simple Knowledge Organisation System)(Simple Knowledge Organisation System) Les ontologies (FRBR – CRM)Les ontologies (FRBR – CRM)
AXIS (AXIS (Acquisition, eXchange, Indexation, Structuration) - TitanAcquisition, eXchange, Indexation, Structuration) - Titan
Références & RemerciementsRéférences & Remerciements
Is realized through
Is embodied in
Is available as
Work
Expression
Manifestation
Item
Antonio VIVALDIStabat Mater, RV. 621
FRBR :FRBR : Functional Requirements for Bibliographic Records : Functional Requirements for Bibliographic Records :
FRBR :FRBR : Functional Requirements for Bibliographic Records : Functional Requirements for Bibliographic Records :
Work
Expression
Manifestation
Item
Person
Corporate body
Responsible Entity
creator
realizer
producer
owner
<foaf:person><foaf:mbox>
<foaf:nick><foaf:interest>
…
•Permet de créer des profils complets.
•Créer des relations entre profils.
FOAF : The friend of a friend
The semantic path :The semantic path :from file to profilesfrom file to profiles
De la conscience à la communication : De la conscience à la communication : La langue comme outil d’indexation (Jacques Derrida)La langue comme outil d’indexation (Jacques Derrida) Un peu de linguistique : signifiant/signifié (Ferdinand de Saussure) - contexteUn peu de linguistique : signifiant/signifié (Ferdinand de Saussure) - contexte
Représentation de l’information :Représentation de l’information : Naissance de la presse écriteNaissance de la presse écrite Les grands media du 20Les grands media du 20èmeème siècle : de l’audio à la vidéo siècle : de l’audio à la vidéo L’Internet : media du 21L’Internet : media du 21èmeème siècle siècle
Les langages pour écrire, afficher, stocker et consulter dans un Les langages pour écrire, afficher, stocker et consulter dans un univers multimédia interactif :univers multimédia interactif :
Le HTML : Hyper Text Mark-up LanguageLe HTML : Hyper Text Mark-up Language Le XML : eXchange Mark-up LanguageLe XML : eXchange Mark-up Language
La Structuration de l’information (langage machine) :La Structuration de l’information (langage machine) : RDF (Resource Description Framework), OWL (Ontology Web Language), SKOS RDF (Resource Description Framework), OWL (Ontology Web Language), SKOS
(Simple Knowledge Object System)(Simple Knowledge Object System) Les ontologies (FRBR – CRM)Les ontologies (FRBR – CRM)
AXIS (AXIS (Acquisition, eXchange, Indexation, Structuration) - TitanAcquisition, eXchange, Indexation, Structuration) - Titan
Références & RemerciementsRéférences & Remerciements
DescriptionInformation
PreservationDescriptionInformation
PackagingInformation
ContentInformation
SIPInformation Package : AIP
DIP
InformationObject
DigitalObject
PhysicalObjectOR
PDI:
- Reference- Context
- Provenance- Fixity
KnowledgeBase
DataObject
RepresentationInformation
Titan – the OAIS visionTitan – the OAIS visionOpen Archival Information SystemOpen Archival Information System
DocumentS
peci
aliz
es
Entity
THINGS
Specializes
-axe-
Sp
eci
aliz
es
-aig-
Sp
eci
aliz
es
-afp-
Sp
eci
aliz
es
Defines
AutonomousResource
Entity
Defines
Specializes
PROFILE
Specializes
ROLEEVENT
MOMENT
PLACEAGENT
OPUSL-CLIPP-CLIP
CONTAINERRESOURCE
PHYSICAL PERSON
MORAL PERSON
PROXY FACILITY
UID-SYSTEM
ONTOLOGY
…
AutonomouseXchange
Entity
Defines
Specializes
Def
ines
Relation
Spe
cial
izes
Term
Specia
lizes
Defines
Expressed in
AXIS AXIS (Acquisition, eXchange, Indexation, Structuration) (Acquisition, eXchange, Indexation, Structuration)
MU
SIC
PR
OF
ILE
AXIS CORE PROFILE
A composite concrete example : A composite concrete example :
Instance
..xml
.odt
..jpg
--afp-
<doc><doc>
<doc><doc>
EVENT
Produces
Involves acting as “composer”
Specialize
..xml
<doc><doc>
<doc><doc>
..odt
..jpg
--afp-
COMPOSER
ALIAS:“TERM” to “ENTITY”
The meaning of “composer”
ROLE
Instance
..xml
<doc><doc>
<doc><doc>
..odt
..jpg
--afp-
WolfgangAmadeusMOZART
PHYSICALPERSON
Instance
<doc><doc>
<doc><doc>
..odt
..jpg
--afp-
Eine kleineNachtmusik
--midi-
OPUS
Composing‘Eine kleine Nachtmusik’
Instance
<doc><doc>
<doc><doc>
-odt-
-afp--bwf-
lClip
Manifested by
Eine kleineNachtmusik
-jpg-
rechercher
Exalead Exalead moteur de recherche «sémantique» :moteur de recherche «sémantique» :
naviguer
Définitions de base Définitions de base pour un univers sémantique :pour un univers sémantique :
Sémantique : Sémantique : l’étude du « sens » des symboles et expressions. Il s’agit de l’étude du « sens » des symboles et expressions. Il s’agit de considérer le « sens » de façon opérationnelle, par la façon dont notre considérer le « sens » de façon opérationnelle, par la façon dont notre organisme réagit à son environnement (y compris lui-même).organisme réagit à son environnement (y compris lui-même).
Langage : Langage : un moyen de communication avec un ensemble de signes un moyen de communication avec un ensemble de signes
(vocaux, gestuels, graphiques, tactiles, olfactifs, etc.) doté d'une (vocaux, gestuels, graphiques, tactiles, olfactifs, etc.) doté d'une sémantique, et le plus souvent d'une syntaxe.sémantique, et le plus souvent d'une syntaxe.
LangueLangue : : un système de signes linguistiques, vocaux ou graphiques ou un système de signes linguistiques, vocaux ou graphiques ou gestuels, qui permet la communication entre les individus, avec une gestuels, qui permet la communication entre les individus, avec une syntaxe et une grammaire.syntaxe et une grammaire.
Métadonnées : Métadonnées : Une métadonnée (du préfixe grec meta et du latin data Une métadonnée (du préfixe grec meta et du latin data "informations") est une donnée servant à définir ou décrire une autre "informations") est une donnée servant à définir ou décrire une autre donnée quel que soit son support (papier ou électronique).donnée quel que soit son support (papier ou électronique).
Une Une ontologieontologie est l'ensemble structuré des termes et concepts est l'ensemble structuré des termes et concepts représentant le sens d'un champ d'informations (interprétable par une représentant le sens d'un champ d'informations (interprétable par une machine). L'ontologie constitue en soi un modèle de données représentatif machine). L'ontologie constitue en soi un modèle de données représentatif d'un ensemble de concepts dans un domaine, ainsi que les relations entre d'un ensemble de concepts dans un domaine, ainsi que les relations entre ces concepts. Elle est employée pour raisonner à propos des objets du ces concepts. Elle est employée pour raisonner à propos des objets du domaine concerné.domaine concerné.
The semantic path :The semantic path :from file to profilesfrom file to profiles
De la conscience à la communication : De la conscience à la communication : La langue comme outil d’indexation (Jacques Derrida)La langue comme outil d’indexation (Jacques Derrida) Un peu de linguistique : signifiant/signifié (Ferdinand de Saussure) - contexteUn peu de linguistique : signifiant/signifié (Ferdinand de Saussure) - contexte
Représentation de l’information :Représentation de l’information : Naissance de la presse écriteNaissance de la presse écrite Les grands media du 20Les grands media du 20èmeème siècle : de l’audio à la vidéo siècle : de l’audio à la vidéo L’Internet : media du 21L’Internet : media du 21èmeème siècle siècle
Les langages pour écrire, afficher, stocker et consulter dans un Les langages pour écrire, afficher, stocker et consulter dans un univers multimédia interactif :univers multimédia interactif :
Le HTML : Hyper Text Mark-up LanguageLe HTML : Hyper Text Mark-up Language Le XML : eXchange Mark-up LanguageLe XML : eXchange Mark-up Language
La Structuration de l’information (langage machine) :La Structuration de l’information (langage machine) : RDF (Resource Description Framework), OWL (Ontology Web Language), SKOS RDF (Resource Description Framework), OWL (Ontology Web Language), SKOS
(Simple Knowledge Organisation System)(Simple Knowledge Organisation System) Les ontologies (FRBR – CRM)Les ontologies (FRBR – CRM)
AXIS (AXIS (Acquisition, eXchange, Indexation, Structuration) - TitanAcquisition, eXchange, Indexation, Structuration) - Titan
Références & RemerciementsRéférences & Remerciements
MEDIA MANAGEMENT FROM ACQUISITION TO PUBLISHING
IN AUDIO-VISUAL/MULTIMEDIA PRODUCTIONS AND ARCHIVING
MediaMap Projet Eureka Celtic
FilmFilm
FILMFILM Scene N° Scene N°
TAKETAKE
MediaMap puts the clip in the clap
MediaMap puts the clip in the clap
http://www.mediamapproject.org
5353
Mediamap is a Eureka Celtic project financed by the DGE (France) - IWT & IRSIB (Belgium)Q4 2008 – Q2 2011
Total effort: 59 man years
http://www.mediamapproject.org
MediaMap - Titan MediaMap - Titan acronym'sacronym's : :
AAEAAE Autonomous Assets Entity (AXIS)Autonomous Assets Entity (AXIS) AXEAXE Autonomous eXchange Entity (AXIS)Autonomous eXchange Entity (AXIS) AXISAXIS Acquisition eXchange Indexing, Structuration (Titan)Acquisition eXchange Indexing, Structuration (Titan) Container Container Container are means to wrap a document in evidence in Container are means to wrap a document in evidence in
order to constitute one SIP, AIP or DIPorder to constitute one SIP, AIP or DIP INDEX INDEX The expression of a sequential link between items The expression of a sequential link between items IWIW Interoperability WicketInteroperability Wicket LIP LIP Labelling Information Package (IASA)Labelling Information Package (IASA) NEMNEM Network and Electronic Media (Platform)Network and Electronic Media (Platform) NESSINESSI Network European Software and Services Initiatives (Platform) Network European Software and Services Initiatives (Platform) OPUSOPUS A complete semantic item (AXIS)A complete semantic item (AXIS) OSB OSB Open Semantic Bus (MediaMap)Open Semantic Bus (MediaMap) PackagePackage An embodiment of information (AXIS) An embodiment of information (AXIS) ProfileProfile By choosing a set of representation formats with a choice of By choosing a set of representation formats with a choice of
parameters, it is possible to get the capacity to represent parameters, it is possible to get the capacity to represent information for a class of applications.information for a class of applications.
USEUSE Unique Semantic Entity (MediaMap)Unique Semantic Entity (MediaMap)
Titan asbl : www. titan.beTitan asbl : www. titan.be
Merci à : Merci à :
Je voudrais remercier toutes les personnes qui ont contribué directement ou indirectement à cette présentation :
Perfect Memory, SKEMA et l’UTC Compiègne, pour les contributions aux développements sur les Ontologies et le projet MediaMap
PROSI* and MEMNON*, en particulier M. Guy Maréchal et M. Michel Merten pour les développements d’AXIS
EBU, en particulier M. Jean-Pierre Evain
TITAN, pour l’organisation des “European Media Wrapper Round Table”
Kane*, pour les benchmarking et conseils en communication
“ISO”, pour la contribution à la normalisation de l’OAIS“W3C”, pour la contribution à la standardisation de RDF & OWL
SUN Microsystems, en particulier Mme Katherine Parker pour l’organisation du PASIG
* Membre Titan