Normalisation des échanges de données en terminologie
description
Transcript of Normalisation des échanges de données en terminologie
![Page 1: Normalisation des échanges de données en terminologie](https://reader036.fdocuments.us/reader036/viewer/2022062315/568152d8550346895dc0f3c9/html5/thumbnails/1.jpg)
Normalisation des échanges de Normalisation des échanges de données en terminologiedonnées en terminologie
Le cas des relations dites Le cas des relations dites « conceptuelles »« conceptuelles »
Laurent Romary & Marc Van CampenhoudtLaurent Romary & Marc Van Campenhoudtavec la voix d ’André Schaaffavec la voix d ’André Schaaff
![Page 2: Normalisation des échanges de données en terminologie](https://reader036.fdocuments.us/reader036/viewer/2022062315/568152d8550346895dc0f3c9/html5/thumbnails/2.jpg)
Représentation et échange des relations : état des lieux
Kif (Knowledge Interchange Format)
CGS (Conceptual Graph Standard)
Oil (Ontology Inference Layer)
XTM (XML Topic Maps : Iso 13250
2000)
![Page 3: Normalisation des échanges de données en terminologie](https://reader036.fdocuments.us/reader036/viewer/2022062315/568152d8550346895dc0f3c9/html5/thumbnails/3.jpg)
Normes d ’échanges : bref historique
Micromater
TEI, chapitre 13
Martif (ISO 12 200, 1999) Fondé sur Iso 12620
Nouveaux projets ISO : Geneter, MSC - DXLT (projet Salt),TMF
Olif 2
![Page 4: Normalisation des échanges de données en terminologie](https://reader036.fdocuments.us/reader036/viewer/2022062315/568152d8550346895dc0f3c9/html5/thumbnails/4.jpg)
TMF - Terminological Markup Framework
![Page 5: Normalisation des échanges de données en terminologie](https://reader036.fdocuments.us/reader036/viewer/2022062315/568152d8550346895dc0f3c9/html5/thumbnails/5.jpg)
Principes généraux
Expression de contraintes au niveau de la représentation de terminologies informatisées
Quelle est la structure sous-jacente des terminologies informatisées ?
Quelle sont les catégories de données utilisées et sous quelles conditions ?
Maintient de l’interopérabilité entre représentations
Proposer un outil conceptuel pour la comparaison de deux formats donnés
![Page 6: Normalisation des échanges de données en terminologie](https://reader036.fdocuments.us/reader036/viewer/2022062315/568152d8550346895dc0f3c9/html5/thumbnails/6.jpg)
Définitions
TMF: Terminological Mark-up Framework Définition de structures sous-jacentes et de mécanismes
nécessaires à la représentation informatisée de données terminologiques
Indépendance vis-à-vis des formats spécifiques
GMT: Generic Mapping Tool Un format XML abstrait équivalent au modèle sous-jacent de
TMF
TML: Terminological Mark-up Language Une représentation spécifique générée dans le cadre de TMF
![Page 7: Normalisation des échanges de données en terminologie](https://reader036.fdocuments.us/reader036/viewer/2022062315/568152d8550346895dc0f3c9/html5/thumbnails/7.jpg)
Une famille de formats…
TMF
TML1 TML2 TML3 TMLi…
(DXLT)(Geneter)
GMT
![Page 8: Normalisation des échanges de données en terminologie](https://reader036.fdocuments.us/reader036/viewer/2022062315/568152d8550346895dc0f3c9/html5/thumbnails/8.jpg)
Meta-modèle
Représentation de la structure sous-jacente de données terminologiques
![Page 9: Normalisation des échanges de données en terminologie](https://reader036.fdocuments.us/reader036/viewer/2022062315/568152d8550346895dc0f3c9/html5/thumbnails/9.jpg)
Modèle conceptuel : structure typique
1 concept
Décrit et défini dans n langues
Désigné par n termes
![Page 10: Normalisation des échanges de données en terminologie](https://reader036.fdocuments.us/reader036/viewer/2022062315/568152d8550346895dc0f3c9/html5/thumbnails/10.jpg)
Langue 1 Langue 2
Langue 3
Définition
Terme 1 Terme 2 Terme...
UsageGrammaire Contexte ...
« Concept »
Langue ...
Exemple : la fiche Dhydro
![Page 11: Normalisation des échanges de données en terminologie](https://reader036.fdocuments.us/reader036/viewer/2022062315/568152d8550346895dc0f3c9/html5/thumbnails/11.jpg)
Le squelette structurel
Terminological Data Collection (TDC)
Global Information (GI) Complementary Information (CI)
Terminological Entry (TE)
Language Section (LS)
Term Level (TL)
Term Component Level (TCL)
*
*
*
*
![Page 12: Normalisation des échanges de données en terminologie](https://reader036.fdocuments.us/reader036/viewer/2022062315/568152d8550346895dc0f3c9/html5/thumbnails/12.jpg)
Comment cela fonctionne ?
Étudions un exemple…
![Page 13: Normalisation des échanges de données en terminologie](https://reader036.fdocuments.us/reader036/viewer/2022062315/568152d8550346895dc0f3c9/html5/thumbnails/13.jpg)
Exemple DXLT :<termEntry id="ID67">
<descrip type="subjectField">manufacturing</descrip><descrip type="definition">A value between 0 and 1 used in ... </descrip><langSet lang="en">
<tig><term>alpha smoothing factor</term><termNote type="termType">fullForm</termNote>
</tig></langSet><langSet lang="hu">
<tig><term>Alfa ... </term>
</tig></langSet>
</termEntry>
![Page 14: Normalisation des échanges de données en terminologie](https://reader036.fdocuments.us/reader036/viewer/2022062315/568152d8550346895dc0f3c9/html5/thumbnails/14.jpg)
Identification du squelette structurel
id=‘ID67’ [attribute]subjectField=‘ manufacturing ’ [typedElement]definition=‘A value…’ [typedElement]
lang=‘ hu ’ [attribute]lang=‘ en ’ [attribute]
term=‘…’ [element]
term=‘alpha smoothing factor’ [element]termType=‘fullForm’ [typedElement]
TE
LS
TStig
langSet
tig
langSet
termEntry
TE: Terminological EntryLS: Language SectionTS: Term Section
![Page 15: Normalisation des échanges de données en terminologie](https://reader036.fdocuments.us/reader036/viewer/2022062315/568152d8550346895dc0f3c9/html5/thumbnails/15.jpg)
Modèle TMF niveau information
TE
TS
LSLS
TS
id=‘ID67’subjectField=‘ manufacturing ’definition=‘A value…’
lang=‘ hu ’lang=‘ en ’
term=‘…’term=‘alpha smoothing factor’termType=‘fullForm’
![Page 16: Normalisation des échanges de données en terminologie](https://reader036.fdocuments.us/reader036/viewer/2022062315/568152d8550346895dc0f3c9/html5/thumbnails/16.jpg)
Représentation GMT<struct type="TE">
<feat type="id">ID67</feat><feat type="subjectField">manufacturing</feat><feat type="definition">A value between 0 and 1 used in ... </feat><struct type="LS">
<feat type="lang">en</feat><struct type="TS">
<feat type="term">alpha smoothing factor</feat> <feat type="termType">fullForm</feat>
</struct></struct><struct type="LS">
<feat type="lang">hu</feat><struct type="TS">
<feat type="term">Alfa ... </feat></struct>
</struct></struct>
![Page 17: Normalisation des échanges de données en terminologie](https://reader036.fdocuments.us/reader036/viewer/2022062315/568152d8550346895dc0f3c9/html5/thumbnails/17.jpg)
Structural Skeleton DCRref (ISO12620)
DCRi
- DCRref subset- Application dependent DCR
Interoperability conditionsGMT
Dialecti
- Expansion structures- DatCat structural styles- DatCat vocabulary styles
Terminological Markup Language (TML)
![Page 18: Normalisation des échanges de données en terminologie](https://reader036.fdocuments.us/reader036/viewer/2022062315/568152d8550346895dc0f3c9/html5/thumbnails/18.jpg)
Catégories de données
Une description formelle
![Page 19: Normalisation des échanges de données en terminologie](https://reader036.fdocuments.us/reader036/viewer/2022062315/568152d8550346895dc0f3c9/html5/thumbnails/19.jpg)
Quel modèle pour les catégories de données ?
Utilisation de XML : Cohérence avec les principes de TMF Utilisation de feuilles de style pour la génération
de schémas et de filtres
Utilisation de RDF (Resource Description Framework) Futur format pour la représentation de méta-
données : La description de catégories de données est synonyme
de méta-donnée dans l’approche TMF
![Page 20: Normalisation des échanges de données en terminologie](https://reader036.fdocuments.us/reader036/viewer/2022062315/568152d8550346895dc0f3c9/html5/thumbnails/20.jpg)
Description d’une catégorie de données
DCDefinition
DCName
Content
dcsd:DCDefinition
dcsd:DCName
dcsd:Content
dcsd:DCIdentifier
dcsd:Level
DCType (S, C)dcsd:DCType
Salt 2000-11-08/SEW
dcsd:DCAdmin
DCComment
dcsd:DCComment
Data Category
Locus
DCAdmin
DCIdentifierDCParent
dcsd:DCParent
DCExample
dcsd:DCExample
![Page 21: Normalisation des échanges de données en terminologie](https://reader036.fdocuments.us/reader036/viewer/2022062315/568152d8550346895dc0f3c9/html5/thumbnails/21.jpg)
Niveaux et contenus
Content
DataType TargetType
Ref to other datcat(s)
dcsd:DataType dcsd:TargetType
rdf:Alt
rdf:li
List of References
List of References
Ref to other datcats
rdf:Alt
rdf:li
Level/Loci
rdf:Alt
Ref to other datcat(s)
rdf:li
List of References
![Page 22: Normalisation des échanges de données en terminologie](https://reader036.fdocuments.us/reader036/viewer/2022062315/568152d8550346895dc0f3c9/html5/thumbnails/22.jpg)
Relations implicites et explicites
Relations implicites Synonymie Équivalence
Relations à expliciter liens lexicaux entre termes :
‘abréviation de’, ‘troncation de’, ‘symbole de’, etc. liens sémantiques entre « concepts »
‘type de’, ‘cause de’, ‘au-dessus de’, etc.
![Page 23: Normalisation des échanges de données en terminologie](https://reader036.fdocuments.us/reader036/viewer/2022062315/568152d8550346895dc0f3c9/html5/thumbnails/23.jpg)
Situer les relations conceptuelles
Au niveau interlangue la relation est valide pour tout équivalent
Concept = noyau de sens commun
Au niveau de chaque langue la relation est valide pour tout synonyme
Concept = unité de compréhension
Au niveau de chaque terme La relation est valide pour un terme donné
Concept = ?
![Page 24: Normalisation des échanges de données en terminologie](https://reader036.fdocuments.us/reader036/viewer/2022062315/568152d8550346895dc0f3c9/html5/thumbnails/24.jpg)
Quelle typologie des relations?
ISO 12620 (1999) typologie élémentaire
espèce-genre, partie-tout, séquentielle (spatiales, temporelles, causales) et associative
imprécision la place de chaque concept dans la relation n’est pas
toujours précisée
![Page 25: Normalisation des échanges de données en terminologie](https://reader036.fdocuments.us/reader036/viewer/2022062315/568152d8550346895dc0f3c9/html5/thumbnails/25.jpg)
Olif 2 (2000)
Open Lexicon Interchange Format inventaire nettement plus étoffé prenant en
compte : les théories de la méronymie l’interaction entre relations sémantiques et syntaxe
mélange des relations lexicales : ‘abréviation de’ sémantiques : ‘synonyme de’ conceptuelles : ‘ fils de’
![Page 26: Normalisation des échanges de données en terminologie](https://reader036.fdocuments.us/reader036/viewer/2022062315/568152d8550346895dc0f3c9/html5/thumbnails/26.jpg)
Quelles informations échanger?
classification typologique du lien
niveau de validité « concept », langue, terme?
autres informations direction éventuelle du «vecteur» formulation du lien dans chaque langue propriétés de la relation restriction trait distinctif ...
![Page 27: Normalisation des échanges de données en terminologie](https://reader036.fdocuments.us/reader036/viewer/2022062315/568152d8550346895dc0f3c9/html5/thumbnails/27.jpg)
Conclusion
Un modèle général pour l’analyse et la représentation de collections de données terminologiques
Un formalisme sous-jacent exprimé en XML, RDF Outils associés
DCSEditor, DCSBrowser, Génération automatique de filtres XSLT et de schémas
XML pour une spécification donnée de TML