180 Conception dune BD INT Management. 181 Plan du document Introductionslide 182 Modèle...

Post on 03-Apr-2015

104 views 0 download

Tags:

Transcript of 180 Conception dune BD INT Management. 181 Plan du document Introductionslide 182 Modèle...

1

Conception d’une BD

INT Management

2

Plan du document

Introduction slide 182 Modèle Entité/Association slide 187

Traduction E/A relationnel slide 194 Rétro-conception slide 206 Généralisation/Spécialisation slide 211

Théorie des dépendances slide 221 Dépendances fonctionnelles slide 227 Décomposition des relations slide 239 Formes normales slide 248

3

Conception indépendante d’un modèle de données

Réalité

Schéma conceptuel

Schémarelationnel

Schémaréseau

Fichiers….

transformation

Introduction

4

Conception relationnelle

Relation universelle

Dépendances fonctionnelles

décomposition

SchémaRelationnelnormalisé

Introduction

5

Conception centraliséeSchéma

conceptuel global

Schémalocal

Schémalocal

….Schéma

local

ProgrammeUtilisateur …

Introduction

6

Conception décentralisée (à partir d’un existant)

intégration

Schémaglobal

Schéma local Schéma local Schéma local

Hétérogène/homogène

Introduction

7

Conception d’une BD Introduction

Réalité

Recueil des besoins et analyse

Besoin de la BD

Conception logique

Schéma conceptuel (haut niveau)

Transformation du modèle

Schéma conceptuel (spécifique SGBD)

Conception physique

Schéma physique (spécifique SGBD)

Indépendant du SGB

DSpécifique à un SG

BD

8

Modèle Entité/Association

Proposé en 1976 (Chen) Nombreuses extensions depuis Avantages :

Utilisé dans la plupart des méthodes de conception (MCD Merise, …)

Simple Graphique Facilite le dialogue avec les utilisateurs

Modèle E/A

9

Concepts Modèle E/A

Graphisme 1 Graphisme 2

Ens. entité

Attribut

Attribut composite

Attribut multivalué

Clé d’un type d’entité

Type d’association

Rôle

Contraintes de cardinalité

Nom Type Entité T

A

A

AssAss

RôleRôle

0,n1,n

10

Concepts (2) Modèle E/A

Graphisme 1 Graphisme 2

Type d’entité faible

Type d’association identifiante

Attribut calculé

Ass (1,1)

11

Modèle E/A Entreprise Modèle E/A

Employé

nomadresseNoSS

nomf prenom

Personne-à-charge Projet

Département

Nb_heures

No_dept libelle

Numéro Descriptionprénom

localisations

Avoir à charge

diriger

Travailler pour

Travailler surgérer

date

0,n 1,n

0,10,n

1,1

1,1

1,11,n

1,1

0,n

Nb_emp

superviser

Supervise0,n

Est supervisé1,1

DateNaissanceParente

12

Modèle E/A EntrepriseGraphisme 2

Modèle E/A

1,n

1,n

1,1

Est supervisé

0,nsupervise

(1,1)

0,n

1,1

1,n

1,10,1

1,n1,1Employe

NoSSAdresseNomfPrenom

Département

No_deptlibelleNb_Emp

Projet

NuméroDescription

PersonneACharge

prénomDateNaissanceParenté

TravaillerPour

Diriger

Date

GérerAvoir a charge

Superviser

TravaillerSur

Nb_heures

localisations

13

UML Entreprise UML

14

Entité-Association / Diagramme de classe UML

Entité-Association Diagramme de Classe

SI – BD Génie logiciel – langages

Entité Classe

Entité faible Composition ? Clé ?

Association sans attribut Association / Composition

Association avec attribut Association + Classe d’association

(Héritage) - Association Héritage

Attribut / Propriété Attribut

Clé

Attribut calculé Méthode

(Attributs multivalués) – Entité + Association Attributs multivalués

Méthode

Cardinalité Multiplicité

UML

15

Traduction EA relationnel La sémantique n’est pas complètement

préservée (il faut ajouter des contraintes d’intégrité)

Règles sont automatisables (de nombreux outils existent sur le marché, AMCDesignor par exemple)

Transformation se fait en 7 étapes Comparaison des concepts des deux modèles :

à faire par l’étudiant

Traduction

16

Étape 1 : transformation des entités non faibles

Type d'entité relation Attribut atomique constituant (attribut) Attributs composites n constituants Attribut(s) clé(s) clé candidate

Traduction

ECA

E(C, A)

17

Exemples d’étape 1 Traduction

Employé Attributs atomiques Employe(noss, adresse)

Attributs composites Employe(noss, adresse, nomf, prenom)

Aplatissement de la structure (suite d’attributs atomiques) perte de la sémantique

Département Attributs atomiques Département(no_dept, libelle)

Attributs multivalués Etape 6 : local

Attributs calculés Etape 7 : nb_emp

Projet Attributs atomiques Projet(numero, description)

18

Étape 2 : transformation des entités faibles Type d'entité faible relation Attribut atomique constituant (attribut) Attributs composites n constituants Attribut(s) clé(s) partie de clé candidate Attributs clés de l’entité identifiante partie

de clé

Traduction

ECA

E2C2A2

(1,1)E2(C, C2, A2)

19

Exemple d’étape 2 Traduction

Entité PersonneACharge

Attributs atomiques PersonneACharge(nom, DateNaissance, parenté)

+

Clé de l’entité identifiante

PersonneACharge(nom, DateNaissance, parenté, noss)

Noss :

clé étrangère sur Employé

+

Partie de la clé de PersonneACharge

20

Étape 3 : transformation des associations binaires monovaluées Clé associée à E1 attribut de E2 Attributs de Ass attributs de E2

Traduction

E1C1A1

E2C2A2

?,1E2(C2, A2, C1, A3)

?,? AssA3

Clé étrangère, pas clé dans E2

21

Exemples d’étape 3 Traduction

TravaillePour Employe(noss, adresse, nomf, prenom, no_dept)

Dirige Département(no_dept, libelle, nosschef, dateDebut)

Dirige monovaluée dans les 2 sens on aurait pu créer

Employe(noss, adresse, nomf, prenom, nodept, nodeptDirigé, dateDebut)

Cardinalités (0,1), association partielle valeurs nulles

Controle Projet(numero, description, numdept)

Supervision Employe(noss, adresse, nomf, prenom, nodept, noSSSuperviseur)

noSSSuperrviseur clé étrangère de Employé sur elle-même

PersonneACharge Cf. étape 2

22

Étape 4 : transformation des associations binaires multivaluées dans les 2 sens Création d'une nouvelle relation Ass Clé de E1 + Clé de E2 clé de Ass Attributs de Ass Attributs de Ass

Traduction

E1C1A1

E2C2A2

?,nAss(C1, C2, A3)

?,n AssA3

TravailleDans TravailleDans(noss, numeroProjet, nb_heures)

23

Étape 5 : Transformation des associations n-aires (n > 2) Idem étape 4 :

Création d'une nouvelle relation Ass Clé de E1 + Clé de E2 + … clé de En clé de

Ass Attributs de Ass Attributs de Ass

Traduction

E1C1A1

E2C2A2

Ass(C1, C2, C3, A4)AssA4

E3C3A3

24

Étape 6 : transformation des attributs multivalués Création d'une nouvelle relation R Attribut multivalué -> constituant Clé du type d'entité associé -> constituant Clé de la relation : tout le schéma

Traduction

DépartementA C R(A, C)

Localisations dans Département LocalisationDept(localisation, num_dept)

25

Étape 7 : transformation des attributs calculés Attribut calculé Requête associée

Traduction

Nb_emp dans Département

Département(no_dept, libelle, nosschef, dateDebut)

SELECT no_dept, COUNT(*)

FROM Employe

GROUP BY no_dept

Couples no département – effectif du département

Associée à une vue relationnelle

26

Récapitulatif de l’exemple

Employe(noss, adresse, nomf, prenom, nodept, noSSSuperviseur)Département(no_dept, libelle, nosschef, dateDebut)Projet(numero, description, numdept)PersonneACharge(nom, noss, DateNaissance, parenté)TravailleDans(noss, numeroProjet, nb_heures)LocalisationDept(localisation, num_dept)

CREATE VIEW Effectifs(no_dept, nb_emp) ASSELECT nodept, COUNT(*)FROM EmployeGROUP BY nodept

CREATE VIEW DepartementComplet ASSELECT D.*, EF.nb_empFROM Département D, Effectifs EFWHERE D.no_dept=EF.no_dept

Traduction

27

Rétro-conception

But : Passer d’un schéma relationnel à un schéma Entité-

Association équivalent Pourquoi ?

Analyse n’a pas été faite ou a été perdue Comment ?

Appliquer les étapes de transformation « à l’envers » Remarque 

Ne fournit pas une solution unique (perte d’information sur le schéma relationnel par rapport au schéma E/A)

Rétro-conception

28

Principes de rétro-conception

Relation ne possédant pas de clé étrangère : ensemble d'entité

Relation possédant une clé étrangère à l'extérieur de sa clé : ensemble d'entité plus association monovaluée vers l'ensemble d'entité correspondant à la clé étrangère

29

Principes de rétroconception (2) Relation dont la clé est intégralement

composée de clés étrangères : association multivaluée entre les ensembles d'entités correspondant aux clés étrangères

Relation dont la clé comprend une clé étrangère et une clé "locale" : ensemble d'entité faible par rapport à l'ensemble d'entité correspondant à la clé étrangère

30

Schéma relationnel BD vins

Vins(num, cru, annee, degre)Recoltes(nvin, nprod, quantite)

Producteurs(num, nom, prenom, region)

Buveurs(num, nom, prenom, ville)

Commandes(ncde, date, nb, nvin, qte)

Livraisons(ncde, no_ordre, qteLivree)

Exemples

31

Rétro-conception de la BD des vins

Rétro-conception

0,n

1,1

(1,1)0,n

1,1

0,n

0,n

0,n

Vins

numcrudegréannee

Producteurs

numnomprenomregion

recoltes

Livraisons

No_ordreqteLivréedate

concerne

Buveurs

numnomprenomville

Commandes

ncdeqtédate

Passer

Donner_lieu

quantite

?

?

1 ?

1 ?

1 ?

1 ?

32

Généralisation / spécialisation Introduire dans le modèle E/A un concept

objet "classique" Permet de définir un ensemble d'entité

relativement à un autre (attention ressemble à entité faible mais est très différent)

33

Sémantique de la généralisation / spécialisation Sous ensemble d'entité hérite des attributs

de son super ensemble d'entité A priori pas d'héritage multiple Spécialisation peut être :

totale (toute instance est spécialisée dans au moins un sous-ensemble) ou partielle

une partition (une instance ne peut être spécialisée dans plusieurs sous-ensembles) ou un recouvrement

34

Exemple de généralisation / spécialisationEnsemble

d'entité AA1A2

Ensembled'entité BB1

Ensembled'entité CC1

Ensembled'entité DD1D2

Super ensemble d'entité

A1A2B1

A1A2C1

A1A2D1D2

T/PA = B C D

B C = C D =

35

Exemple de généralisation / spécialisation

PERSONNEnomprénomadresse

ETUDIANTnoétudcycle

SALARIEsalaire

T/RP = E S

E S

PRIVEprime

PUBLICindice

T/PS = PR PU PR PU =

36

Transformation G / S vers modèle relationnel (1) Approche par généralisation

feuille : relation de base dont le schéma est l'union des attributs de la feuille jusqu'à la racine

non feuille : vue définie comme union des fils (avec projection sur les attributs communs)

37

Conséquences

Pas de création d'instances sur les non feuilles Accès aux feuilles peu coûteux Accès aux non feuilles par union-projection Une même instance peut être spécialisée dans

plusieurs entités Pas vraiment de notion "d'identité d'objet" (donc pas

de partage de structure) Evolution de schéma difficile

38

Exemple de transformationCREATE TABLE ETUDIANT(nom, prénom, adresse, noétud, cycle)CREATE TABLE PRIVE(nom, prénom, adresse, salaire, prime)CREATE TABLE PUBLIC(nom, prénom, adresse, salaire, indice)CREATE VIEW SALARIE AS

SELECT nom, prénom, adresse, salaire FROM PRIVE UNIONSELECT nom, prénom, adresse, salaire FROM PUBLIC

CREATE VIEW PERSONNE ASSELECT nom, prénom, adresseFROM ETUDIANT UNIONSELECT nom, prénom, adresseFROM SALARIE

39

Transformation G / S vers modèle relationnel (2) Approche par spécialisation

chaque noeud : relation dont le schéma est constitué des attributs "locaux"

chaque instance : on rajoute un oid (ou surrogate) héritage : on ajoute l'oid de l'instance mère

comme clé étrangère dans l'instance fille

40

Conséquences Création d'instance à n'importe quel niveau

dans l'arbre d'héritage Accès coûteux aux instances "loin" de la racine

(reconstruction par jointures) Héritage multiple difficile Notion d'oid est offerte (partage de structure

possible) Multi-instanciation possible Evolution de schéma plus facile

41

Exemple de transformationCREATE TABLE PERSONNE(idfP, nom, prénom, adresse)

CREATE TABLE ETUDIANT(idfE, noétud, cycle, idfP)

CREATE TABLE SALARIE(idfS, salaire, idfP)

CREATE TABLE PUBLIC(idfPU, indice, idfS)

CREATE TABLE PRIVE(idfPR, prime, idfS)

CREATE VIEW PERSONNE ASSELECT nom, prénom, adresse FROM PERSONNE

CREATE VIEW ETUDIANT AS

SELECT P.nom, P.prénom, P.adresse, E.noétud, E.cycle

FROM PERSONNE P, ETUDIANT E

WHERE P.idfP = E.idfP

...

42

Théorie des dépendances

Normalisation des schémas relationnels

43

Objectifs Mauvaise conception => Redondance des

données anomalies de maj (valeurs dupliquées) anomalies d’insertion (valeurs nulles, incohérences) anomalies de suppression (pertes d'information non

désirées) Introduire une notion de "bon" schéma (sans

redondance d'informations) permet de comparer deux schémas

44

Exemple de mauvaise conceptionRelation APPROVISIONNEMENTPRODUIT QUANTITE COULEUR FOURNISSEUR ADRESSE

parapluie 110 rouge Labaleine Paris

Chapeau 50 vert Lemelon Lyon

sac à main 65 noir Toutcuir Lyon

parasol 15 jaune Labaleine Paris

ombrelle 5 rouge Labaleine Paris

ceinture 25 vert Letour Nantes

sac à main 65 noir Legrand Paris

45

Outils proposés

Étudier les propriétés des données dépendances fonctionnelles dépendances multi-valuées dépendances produits, ...

Formes normales ordre partiel sur les schémas

Algorithmes de décomposition / synthèse pour obtenir des schémas en 3ème forme normale

46

Décomposition d’une relation

Relation universelle DF

nom nc nb

ville nv

dateexp datec Normalisation

prénom qtéexp qtéc R1(.....)

R2(....)

......

47

Les dépendances fonctionnelles

48

Dépendance fonctionnelle (DF) Propriété définie sur le schéma

cas particulier de contrainte d'intégrité définie sur l'intension (donc valide qq soit

l'extension) Définition

B dépend fonctionnellement de A si, étant donné une valeur de A, il lui correspond une unique valeur de B (quel que soit l'extension)

A et B sont des ensembles d'attributs Notation A B

49

Exemple

BUVEURS(nb, nom, prénom, ville) COMMANDES(nc, datec, nv, qtéc, nb) EXPEDITIONS(nc, dateexp, qtéexp)

50

Exemples de DF

NB NOM

NB PRENOM

NB VILLE

NC DATEC

NC NB

NC NV

NC QTEC

NC, DATEEXP QTEEXP

NOM VILLE ?

NB NV ?

QTEC QTEEXP ?

51

Axiomes d’Armstrong

Réflexivité Y X X Y

Augmentation X Y XZ YZ

Transitivité X Y et Y Z X Z

52

Propriétés déduites

Union X Y et X Z X YZ

Pseudo-transitivité X Y et YW Z XW Z

Décomposition X Y et Z Y X Z

53

Fermeture transitive

Fermeture transitive d'un ensemble F de DF est notée F+

F+ = F U DF obtenues via les axiomes Par exemple

NC NB et NB NOM donc NC NOM NB NOM donc NB, NV NOM, NV essentiellement transitivité et pseudo-transitivité

54

Graphe de dépendances fonctionnelles Noeuds = attributs Arcs = DF

nc nb

datec nv qtéc nom prénom ville dateexp

qtéexp

55

Graphe de fermeture transitive

nc nb

datec nv qtéc nom prénom ville dateexp

qtéexp

56

Dépendance fonctionnelle élémentaire Une dépendance fonctionnelle X A est dite

élémentaire si A n’est pas inclus dans X il n’existe pas X’ inclus dans X tel que X’ A

Permet de simplifier la fermeture transitive (sinon on peut toujours créer de nouvelles DF par augmentation)

Exemple : NB NOM NB, NV NOM non DFE

57

Couverture minimale Définition

sous ensemble minimum de DF élémentaires permettant de générer toutes les autres

Exemple(nb nom; nb prénom; nb ville; nc datec; nc nb; nc nv; nc qtéc;nc, dateexp qtéexp)

ThéorèmeTout ensemble de DF admet une couverture minimale, en général non unique

58

Clé d’une relation Définition

ensemble minimum d’attributs permettant de déterminer tous les autres

Soit R(A1, A2, ..., An) un schéma de relation. Soit F+ l’ensemble des DF associées à R. X (sous-ensemble d'attributs de R) est une clé de R ssi : X A1, A2, ..., An

il n’existe pas de sous-ensemble Y de X tel que Y A1, A2, ..., An

59

Clé d’une relation (2)

Exemple nc, dateexp est une clé du schéma coopérative

Remarques une même relation peut avoir plusieurs clés il existe toujours au moins une clé (au pire on

prend tout le schéma)

60

Décomposition des relations

61

Décomposition d’une relation Décomposition d’un schéma de relation

La décomposition d’un schéma de relation R(A1, A2, ..., An) est sa substitution par un ensemble de schéma de relations R1, R2, ..., Rp telles que : schéma(R) schéma(R1) schéma(R2) ...

schéma(Rp)

Critères de bonne décomposition Décomposition sans perte d'informations Décomposition préservant les DF

62

Décomposition sans perte d'informations La décomposition d’un schéma de relation

R(A1, A2, ..., An) par un ensemble de schéma de relations R1, R2, ..., Rp est sans perte d'informations ssi : R R1 R2 ... Rp

63

Décomposition préservant les DF Soit R(A1, A2, ..., An) et DFR (ens. de DF

associé) la décomposition de R en R1, R2, ..., Rp (avec

DFR1, ...DFRn resp. ens. de DF de R1, ..., Rn) préserve les DF ssi :DFR

+ = DFR1+ U ... U DFRn

+

64

Exemples de décomposition

Commandes(nc, datec, nv, qtéc, nb, nom, prénom, ville) C(nc, datec, nv, qtéc, nb) et B(nom, prénom,

ville) : perte d'info C(nc, datec, nv, qtéc, nb) et B(nb, nom, prénom,

ville) : pas de perte d'info et préservation DF C(nc, nb) et B(nc, datec, nv, qtéc, nom, prénom,

ville) : pas de perte d'info et perte de DF (nb nom par exemple)

65

Principe de décomposition binaireR(X,Y,Z) et X Y

R(X,Y,Z)=R1(X,Y) R2(X,Z)

on peut toujours décomposer une relation suivant une DF

on ne peut pas décomposer une relation s'il n'y a pas de DF

la décomposition selon une DF préserve l'information

66

Algorithme de décomposition

Commandes(nc, datec, nv, qtéc, nb, nom, prénom, ville)

nb nom; nb prénom; nb ville;nc datec; nc nb; nc nv; nc qtéc;nc, dateexp qtéexp

Commandes(nc, datec, nv, qtéc, nb, nom, prénom, ville)

C1(nc, datec, nv, qtéc)

C2(nc, nb)

C(nc, nb, nom, prénom, ville)

C3(nb, nom, prénom, ville)

nc datec, nv, qtéc

nb nom, prénom, ville

67

Algorithme de décomposition

Garantie que la décomposition soit sans perte (puiqu'on suit le principe de décomposition binaire)

Pas de garantie que la décomposition préserve les DF

Décomposition n'est pas unique (dépend de l'ordre du choix des DF dans la décomposition)

68

Autre décomposition

Commandes(nc, datec, nv, qtéc, nb, nom, prénom, ville)

C2(nc, datec, nv, qtéc, nb)C1(nb, nom, prénom, ville)

nb nom, prénom, ville

69

Formes normales

70

Formes normales

Première forme normale Deuxième forme normale Troisième forme normale ...

71

1ère forme normale

Définition Une relation est en première forme normale si

tous ses attributs sont atomiques (inhérent au modèle relationnel)

Un attribut atomique n’est pas : multivalué (liste de valeurs) composé (structuré en sous-attributs)

72

Deuxième forme normale

Définition Une relation est en deuxième forme normale ssi :

elle est en première forme normale tout attribut non clé dépend de la totalité de toutes les

clés

Exemple C(nc, dateexp, qtéexp, nb) pas en 2FN car nc,

dateexp clé et nc nb

73

Troisième forme normale Objectif : élimination des redondances dues

aux dépendances fonctionnelles déduites par transitivité

Définition Une relation est en troisième forme normale ssi :

elle est en deuxième forme normale il n’existe aucune DF entre attributs non clé

74

Comment calculer une forme normaleSoit R(A1, ..., An) et DFR ens. de DF associé

calculer DFR+

déterminer la (les) clé (s) de R partitionner les attributs en attributs clés (ils

appartiennent à au moins une clé) et attributs non clés

appliquer les définitions de forme normale (depuis la 1ère)

75

Propriétés

Toute relation R admet au moins une décomposition en 3FN qui préserve l'information et les DF

Deux approches pour la calculer : décomposition : on s'arrête dès que les

relations dérivées sont en 3FN (mais pas de garantie sur les DF)

synthèse à partir de la couverture minimale

76

Algorithme de synthèse en troisième forme normale

Pré : connaissance du contenu de la relation universelle + DF Principe de l’algorithme :

A partir du graphe G des DF, calculer une couverture minimale C Editer l’ensemble des attributs isolés dans une même relation (tous

sont clés) Recherche le plus grand ensemble X d’attributs qui détermine

d’autres attributs Editer la relation R(X, A1, ..., An)

Supprimer les DF X A1, .., X An du graphe de couverture minimale C

Supprimer les attributs isolés de C Reprendre l’opération à partir de l’étape 3 jusqu’à ce que C soit vide

77

Insuffisance de la 3FN

Relation VINS(CRU, PAYS, REGION)Chenas, France, BeaujolaisJuliénas, France, BeaujolaisChablis, France, BourgogneChablis, USA, Californie

avec les DF suivantes :région pays; cru, pays régionVINS est en 3FN, pourtant il y a des

redondances (ici on peut régler cela avec la 3FN Boyce Codd Kent)

78

Conclusion sur la normalisation Permet d'affiner une conception de schéma

Peut se coupler avec une démarche de conception "à la Merise"

Inconvénient majeur : on suppose qu'on possède une couverture minimale des DF (si on a oublié une DF tout est faux)

Autres formes normales avec d'autres types de dépendance

Peut être remis en cause au niveau physique (dénormalisation)