Chapitre 6 Réseaux récurrents. GPA-779 Application des réseaux de neurones et des systèmes...

Chapitre 6

Réseaux récurrents

GPA-779 Application des réseaux de neurones et des systèmes expertsCours #7 - 2

Plan Structure du réseau de Hopfield

Dynamique Apprentissage Application à l’optimisation Machine de Boltzmann

Découverte J. Hertz, A. Krogh et R.G. Palmer,

Introduction to the theory of Neural Computation, Addison-Wesley, 1991. Classique Orienté « sciences pures » (physique) Auteurs: chercheurs en physique stat. Cours d’études supérieures Approche théorique

R.J. Schalkoff, Artificial Neural Networks, McGraw Hill, 1997 Approche matricielle Cours d’études supérieures Beaucoup d’exemples Couvre la plupart des modèles

L. Fausett, Fundamentals of Neural Networks, Prentice Hall, 1994 Livre de référence pour les éditions

précédentes du cours (avant 2004)

Découverte informatique Matlab Student version with Simulink Learning Matlab 7 Learning Simulink 6 3 CDs pour installation– Windows– Linux– MacOS X

6.1 Architecture du réseau de Hopfield

Article à l’origine: John Hopfield, 1982, Neural Networks and physical systems with emergent collective computational abilities

Principe de base: Système nerveux possède des états stables localement. Ces états stables permettent d’emmagasiner de l’information qui agit comme attracteur.

Un état est présenté au réseau, qui tend alors vers un état stable en minimisant son énergie

Inspiration: verres de spin

Modèle de neurone

Vi Vj Ti

i Vi Vj

Tij =T ji

Vj =1 si TijVii

∑ ≥ 0

Vj = −1 si TijVii

∑ < 0

Exemple

Énergie d ’un réseau de Hopfield

E=−12 TijViVj

i∑ − SiVi

Le système tend vers son état d’énergie minimal :

• Décroissance assurée de la fonction d’énergie

• Neurones activés à 1

• Activations calculées une à une

• Attention aux minima locaux (A) !

Exemple de calcul de l’énergie

E=−V1V3T13+V1V2T12+V2V3T23[ ]−S1V1+S3V3[ ]

−E=−4+(−2)+(−1)+1+(−1)

−E=−7

E=−12 TijViVj

i∑ − SiVi

Un réseau simple de Hopfield

6.2 Dynamique du réseau: relaxation

Objectif : Partir d’un niveau d’énergie donné, atteindre le minimum local le plus proche pour récupérer l’information stockée (état stable)

Conditions initiales : Forme P Si

Poids : Fixes (calculés lors d’un apprentissage antérieur)

Neurones : a) Activations calculées une à une b) Selon une séquence aléatoire

c) Valeurs 1 pour assurer la minimisation de la fonction d’énergie.

Résultat : Minimisation de la fonction d’énergie et rappel de formes similaires précédemment enregistrées lors de l’apprentissage

Relation entre changement d’état et minimisation de l’énergie

E=−12 TijViVj

i∑ − SiVi

Si le neurone ne change pas d’état :

Si le neurone change d’état :

ΔE=E t+1( )−E t( )

ΔE=−ΔVk TikVi+Ski≠k∑⎛

⎝ ⎜ ⎞

Net(k)

Soit Vk l’activation d’un neurone k quelconque :

Exemple pour montrer l’équivalence

E=−V1V3T13+V1V2T12+V2V3T23[ ]−S1V1+S3V3[ ]

−E=−4+(−2)+(−1)+1+(−1)

−E = −7⇒ E i = +7

E=−12 TijViVj

i∑ − SiVi

Neurone V1 1 -1

−E f = +4 + 2 −1−1−1

E f = −3⇒ E↓⇒ changement accepté

net1 = S1 − 2V2 + 4V3 =1− 2 − 4 = −5

V1 = −1

Relation entre changement d’état et minimisation de l’énergie (2)

ΔE=−ΔVk TikVi+Ski≠k∑⎛

⎝ ⎜ ⎞

ΔVkestpositifssi Tiki≠k∑ Vi+Skestpositif

ΔVkestnegatifssi Tiki≠k∑ Vi+Skestnegatif

Vk t( )=Vk t+1( )

Vk t( )≠Vk t+1( )

Si on a un changement d’état alors on est assuré de diminuer E :

Algorithme de relaxation

Vj tous visités ?

Tirage aléatoire d’une séquence de visite des neurones

Sélection du prochain neurone de la séquence

Vk=1si TikVi+Ski∑ ≥0

P stable ?

NonOui

DÉPART

Vk=−1si TikVi+Ski∑ <0

Exemple de relaxation

Les états stables du réseau

6.3 Apprentissage « tailler » la courbe d’énergie

La règle la plus simple: Hebb L’apprentissage est réalisé AVANT d’utiliser le réseau comme mémoire associative pour retrouver la forme emmagasinée à partir d’information partielle ou bruitée

ExerciceExample 3.22 (Fausett)

a) Stocker le vecteur (1,1,1,-1) par apprentissage hebbien

b) Présenter (-1,-1,1,-1) lors de la phase de relaxation

c) Déterminer le nombre correct d’itérations

d) Calculer la mise à jour de la fonction d’énergie pour chaque mise à jour de l’activation des neurones

6.4 Optimisation Une fonction de coût remplace la fonction d’énergie

L’optimisation consiste à minimiser la fonction de coût

La fonction de sortie utilisée est la fonction sigmoïde (au lieu de la fonction signe ou échelon)

tanhnet2

⎛ ⎝ ⎜

⎞ ⎠ ⎟ ou

1+ e−net

Exemple: Voyageur de commerceUn vendeur doit établir un itinéraire de visite de 5 villes. Il doit partir de Boston et revenir à Boston à la fin de son itinéraire.

Chaque ville est visitée une et une seule fois L’itinéraire doit être le plus court possible afin de minimiser les frais d’essence

La principale difficulté rencontrée avec ce type de problème est l’explosion combinatoire des solutions à évaluer.

Itinéraires possibles :

5 villes = 1210 villes = 181440100 villes = 4.67 *10155

# parcours =n!2n

Réseau de Hopfield Lignes villes Colonnes séquence de visite

Poids contraintes du problème à résoudre– 1 ville visitée 1 seule fois

– 1 étape 1 seule ville– Distance entre les villes

Activation du réseau minimisation du coût

Fonction de coût (à minimiser) : 4 contraintesC1: Favoriser les états avec chaque cité visitée une seule fois 1 neurone activé par ligne

C2: Favoriser les états avec une seule valeur de position (par exemple, éviter que 2 villes soient visitées à l’étape 3) 1 neurone activé par colonne

C3: Favoriser les états qui incluent les n villes

C4: Favoriser les états avec les distances totales les plus courtes

Fonction de coût C

C≡E=A2 Vxij≠i∑

x∑ Vxj+B2 Vxi

y≠x∑

i∑ Vyi+C2 Vxi−n

x∑⎛

⎝ ⎜ ⎞

+D2 dxyVxiVy,i+1+Vy,i−1( )i∑

y≠x∑

Vxi : neurone correspondant à la ville x à l’étape i

dxy : distance entre les villes x et y

A, B, C, D : facteurs de pondération pour les contraintes

C1 C2 C3 C4

Fonction de coût C

x∑ Vxj+B2 Vxi

y≠x∑

i∑ Vyi+C2 Vxi−n

x∑⎛

⎝ ⎜ ⎞

y≠x∑

1.Une matrice n’a pas plus de un 1 dans chaque ligne si chaque produit scalaire possible colonne par colonne est nul

La double somme de droite exprime les N-1 produits scalaires de la colonne i (visite) pour une ligne (ville) x avec les autres colonnes

La sommation de gauche exprime la sommation de toutes les possibilités énumérées à l’étape précédente

Fonction de coût C

x∑ Vxj+B2 Vxi

y≠x∑

i∑ Vyi+C2 Vxi−n

x∑⎛

⎝ ⎜ ⎞

y≠x∑

2. Pénalité pour deux 1 ou plus dans chaque colonne

Fonctionnement similaire à la contrainte précédente

mais pour contrôler le nombre 1 dans chaque colonne.

Fonction de coût C

x∑ Vxj+B2 Vxi

y≠x∑

i∑ Vyi+C2 Vxi−n

x∑⎛

⎝ ⎜ ⎞

y≠x∑

3. Contrainte pour s’assurer que la matrice ne contienne pas que des 0

En effet les deux contraintes précédentes pourraient ne donner que des 0 et le réseau ne serait d’aucune utilité : la meilleure facon de minimiser les frais de déplacements est de ne pas voyager.

Cette contrainte pénalise aussi le fait d’avoir plus ou mois de n 1 dans le réseau

Fonction de coût C

x∑ Vxj+B2 Vxi

y≠x∑

i∑ Vyi+C2 Vxi−n

x∑⎛

⎝ ⎜ ⎞

y≠x∑

4. Exercice à faire à la maison

…….

Calcul des poids

Wxi,yj=−Aδxy1−δij( )−Bδij 1−δxy( )−C−Ddxyδj,i+1+δj,i−1( )

sinon 0

:Kronecker deopérateur l' avec

Chapitre 6 Réseaux récurrents. GPA-779 Application des réseaux de neurones et des systèmes...

Documents

Transcript of Chapitre 6 Réseaux récurrents. GPA-779 Application des réseaux de neurones et des systèmes...

Economie et régulation des réseaux: urbanisation ...

Administration et Sécurité des Réseaux

Fondements de l’algorithmique des réseaux

Sécurité des Réseaux - Ensimag...Sécurité des Réseaux Cryptographie Rök stone, Suède, 800 ac « The magic words are squeamish ossifrages » Sécurité des Réseaux 4MMSR -

Instruments d’évaluation des réseaux routiers

Réseaux de neurones récurrents pour le traitement ...

Optimisation des réseaux WAN avec CISCO WAAS

Supervision Des réseaux et des usines plus efficaces

INTRODUCTION AUX RESEAUX DE NEURONES€¦ · A • Présentation générale des réseaux de neurones B • Application des réseaux neuronaux en Automatique Introduction aux réseaux

L'email au coeur des réseaux soc

Analyses probabilistes pour l'étude des réseaux ...

Modélisation fractale des réseaux électriques · des réseaux électriques modernes.Pour résoudre ces problèmes,nous proposons une démarche de modélisationet d’analyse basée

COURS D'ADMINISTRATION DES RÉSEAUX INFORMATIQUES

La dynamique des réseaux coopératifs. L’exemple …...La dynamique des réseaux coopératifs. L’exemple des logiciels libres et du projet d’encyclopédie libre et ouverte Wikipédia.

Optimisation et analyse des résesaux intelligents et des réseaux ...

Techniques de l’eau et calcul des réseaux

Applications des Réseaux de Neurones pour la reconnaissance des ...

Panorama des réseaux sociaux

Projet mystique, réseaux sociaux et mobilisation des ...

A SSISES des Réseaux de Cancérologie