Optimisation par Colonies de Fourmis pour le E-Learning : optimisation de parcours pédagogiques
Yann SEMETProjet Fractales, INRIA Rocquencourt
"ACO & E-Learning" JET 9 - 2 Avril 2003 - Université Paris V 2
Itinéraire Le site Paraschool Problème et solution Détails algorithmiques Procédures de sélection Simulations et tests réels Perspectives
"ACO & E-Learning" JET 9 - 2 Avril 2003 - Université Paris V 3
Le site Paraschool
"ACO & E-Learning" JET 9 - 2 Avril 2003 - Université Paris V 4
Le site Paraschool
"ACO & E-Learning" JET 9 - 2 Avril 2003 - Université Paris V 5
Le site Paraschool
"ACO & E-Learning" JET 9 - 2 Avril 2003 - Université Paris V 6
Le site Paraschool
"ACO & E-Learning" JET 9 - 2 Avril 2003 - Université Paris V 7
Le site Paraschool
"ACO & E-Learning" JET 9 - 2 Avril 2003 - Université Paris V 8
Optimisation par Colonies de Fourmis (A CO) Paradigme inspiré des colonies
d’insectes sociaux Agents multiples et simples Balance information stigmergique
et heuristique locale Solution « émergente » Efficace, souple, facile à écrire
(métaphore des agents)
"ACO & E-Learning" JET 9 - 2 Avril 2003 - Université Paris V 9
Un exemple
1
2
3
4Nid Source
"ACO & E-Learning" JET 9 - 2 Avril 2003 - Université Paris V 10
Fourmis et voyageurs de commerce (ACO&TSP)
Application classique Excellents résultats obtenus par
méthodes hybrides
kJlilil
ijijkij
d
dp
i
l1
j
ln
lk
"ACO & E-Learning" JET 9 - 2 Avril 2003 - Université Paris V 11
Modèle : graphe pédagogique
1
2
3
5
4 6
7
"ACO & E-Learning" JET 9 - 2 Avril 2003 - Université Paris V 12
W : structure pédagogique
1
2
3
« Produit d’un vecteur par un réel »
« Vecteurs colinéaires »
« Alignement, parallélisme et vecteurs »
W=5
W=1
"ACO & E-Learning" JET 9 - 2 Avril 2003 - Université Paris V 13
W : structure pédagogique
1
2
3
5
4 6
7
1
5
0.1
10
11
"ACO & E-Learning" JET 9 - 2 Avril 2003 - Université Paris V 14
Un problème d’optimisation Maximiser : succès pédagogique Trouver la bonne valuation Contraintes :
Pédagogiques Facteurs individuels Facteurs collectifs
"ACO & E-Learning" JET 9 - 2 Avril 2003 - Université Paris V 15
Fourmis & Phéromones
Communication stigmergique 2 types de phéromone : S et F
Dépôt : mémoire Rétro-propagation : portée
pédagogique Évaporation : dynamisme
Pour une valuation plus pertinente
"ACO & E-Learning" JET 9 - 2 Avril 2003 - Université Paris V 16
Rétro-propagation : Succès
1
2
3
5
4 6
7
31
41
21 1
WS+=1
F
WS+=1/2F
WS+=1/3F
WS+=1/4F
"ACO & E-Learning" JET 9 - 2 Avril 2003 - Université Paris V 17
Rétro-propagation : Échec
1
2
3
5
4 6
7
32
42
22 2
WSF+=2
WSF +=2/2
WSF +=2/2
WSF +=2/2
"ACO & E-Learning" JET 9 - 2 Avril 2003 - Université Paris V 18
S/F : évaporation
: taux d’évaporation ; x=t Portée pédagogique temporelle Exploration dynamique Adaptabilité
1 tx
t SS
"ACO & E-Learning" JET 9 - 2 Avril 2003 - Université Paris V 19
Mémoire individuelle : H Un 1er facteur individuel Modèle de la mémoire volatile Une valeur par nœud et par étudiant Application de NxI dans R Nœud non visité : H=1 Nœud réussi : H=0.5 Nœud raté : H=0.75
"ACO & E-Learning" JET 9 - 2 Avril 2003 - Université Paris V 20
H : anti-évaporation
=constante de temps ; x=t H revient naturellement vers 1
x
x
t
ttt e
e
H
HHH
1
111
1
11
"ACO & E-Learning" JET 9 - 2 Avril 2003 - Université Paris V 21
Une mesure de fitness
Mesure unifiée d’excellence locale Mesure la « désirabilité » des arcs
FSWinHiaf FSWHnn ),(),( 221
"ACO & E-Learning" JET 9 - 2 Avril 2003 - Université Paris V 22
Désirabilité des arcs Balance heuristique
locale/information stigmergique. Cf TSP
Un arc est désirable lorsqu’il est : renforcé les professeurs (W élevé) témoin de succès (S élevé) non témoin d’échecs (F bas) nouveau ou oublié (H proche de 1)
"ACO & E-Learning" JET 9 - 2 Avril 2003 - Université Paris V 23
Sélection d’arcs Sélection d’un arc à proposer
parmi les arcs sortants Deux forces :
Fitness (exploitation) Hasard (exploration)
Balance réglable : s
"ACO & E-Learning" JET 9 - 2 Avril 2003 - Université Paris V 24
Procédures implémentées
Roulette Sélection par le rang : seuils
automatiques et manuels Tournoi Tournoi stochastique
"ACO & E-Learning" JET 9 - 2 Avril 2003 - Université Paris V 25
Tests : Simulations
Une population d’étudiants : G(0.5,1/3)
A chaque étudiant i son niveau A chaque nœud sa difficulté :
0.0<d<1.0 Si niveau(i)>d succès, sinon échec
"ACO & E-Learning" JET 9 - 2 Avril 2003 - Université Paris V 26
Un test élémentaire
1
2
3
5
W=1
W=5
Taux de succès :
90% si n-1=2
10% si n-1=3
Objectif : rétablir la situation, encourager 2
"ACO & E-Learning" JET 9 - 2 Avril 2003 - Université Paris V 27
Comportements
"ACO & E-Learning" JET 9 - 2 Avril 2003 - Université Paris V 28
Courbes de calibrage
"ACO & E-Learning" JET 9 - 2 Avril 2003 - Université Paris V 29
Application réelle En cours ! Mode silencieux Observations préliminaires
encourageantes : Faisabilité technique Structuration autonome du graphe Émergence de nœuds singuliers
Travail à venir
"ACO & E-Learning" JET 9 - 2 Avril 2003 - Université Paris V 30
Résumé, Perspectives
L’E-Learning comme un problème d’optimisation
Un nouveau champ d’applications pour l’intelligence en essaim
Une nouvelle façon de faire du design évolutionnaire interactif
MERCI !
« Ant Colony Optimisation for E-Learning : Observing the Emergence of Pedagogic Suggestions »
Y.Semet, Y. Jamont, R. Biojout, E. Lutton, P. Collet-
Projet Fractales, INRIA RocquencourtUniversité de Technologie de Compiègne
-
"ACO & E-Learning" JET 9 - 2 Avril 2003 - Université Paris V 32
Annexes
"ACO & E-Learning" JET 9 - 2 Avril 2003 - Université Paris V 33
H : calibrage de
Oublier un exercice : H va de 0.5 à 0.9
Oublier prend 1 semaine (x=604800s)
=3.6E-6
)1
1ln(1
x
"ACO & E-Learning" JET 9 - 2 Avril 2003 - Université Paris V 34
La roulette
E=nœuds accessibles depuis ni
Probabilité proportionnelle au fitness Automatique mais pas réglable Sensible, parfois trop
Ennn
nn
nn
k
ki
ji
ji af
afap
)(
)()(
"ACO & E-Learning" JET 9 - 2 Avril 2003 - Université Paris V 35
Sélection par le rang I
Probabilité de sélection inversement proportionnelle au rang
Réduction automatique des écarts Non réglable Peut être insuffisamment subtil
"ACO & E-Learning" JET 9 - 2 Avril 2003 - Université Paris V 36
Sélection par le rang II
Probabilités attribuées manuellement pour chaque rang
Complètement paramétrable Lourd
"ACO & E-Learning" JET 9 - 2 Avril 2003 - Université Paris V 37
Sélection par tournoi
S1 arcs sortants tirés au hasard Le meilleur est choisi 1 paramètre de contrôle
"ACO & E-Learning" JET 9 - 2 Avril 2003 - Université Paris V 38
Tournoi stochastique On choisit d’abord le pire arc S1 « challengers » sont essayés
l’un après l’autre Si plus fort, le « challenger »
remplace son prédécesseur avec une probabilité s2
2 paramètres de contrôle
"ACO & E-Learning" JET 9 - 2 Avril 2003 - Université Paris V 39
Prolongements Nouveaux facteurs individuels
(agenda, excellence, etc.) Nouveaux facteurs collectifs (e.g.
coupe de re-médiation) Observation avant tout
"ACO & E-Learning" JET 9 - 2 Avril 2003 - Université Paris V 40
Facteurs clés
Écoute de l’équipe pédagogique Écoute des élèves Davantage que l’optimisation
computationelle
"ACO & E-Learning" JET 9 - 2 Avril 2003 - Université Paris V 41
Résumé Un problème d’optimisation : chercher
la bonne valuation des arcs d’un graphe de navigation pédagogique
Solution proposée : agents, communication stigmergique, sélection semi-aléatoire
Éléments de calibrage Premières observations
encourageantes
Top Related