L2 Vie Arti ciellesebag/Slides/L2V_4.pdf · 2013. 12. 6. · 4. Thomas Schelling, 3 Une s egr...
Transcript of L2 Vie Arti ciellesebag/Slides/L2V_4.pdf · 2013. 12. 6. · 4. Thomas Schelling, 3 Une s egr...
![Page 1: L2 Vie Arti ciellesebag/Slides/L2V_4.pdf · 2013. 12. 6. · 4. Thomas Schelling, 3 Une s egr egation se produit 5. Dans la vraie vie 6. ... bootstrap I Lien entre entropie et diversit](https://reader033.fdocuments.us/reader033/viewer/2022051900/5fee80c051a96a79582b5726/html5/thumbnails/1.jpg)
L2 − Vie Artificielle
Alexandre Allauzen − Michele SebagLIMSI − LRI
5 dec. 2013
1
![Page 2: L2 Vie Arti ciellesebag/Slides/L2V_4.pdf · 2013. 12. 6. · 4. Thomas Schelling, 3 Une s egr egation se produit 5. Dans la vraie vie 6. ... bootstrap I Lien entre entropie et diversit](https://reader033.fdocuments.us/reader033/viewer/2022051900/5fee80c051a96a79582b5726/html5/thumbnails/2.jpg)
Overview
Automates cellulaires, applications
Robotique evolutionnaireGeneralites
Etat de l’artUn critereEvolutionEvolution et Transfert d’informationExperiences
2
![Page 3: L2 Vie Arti ciellesebag/Slides/L2V_4.pdf · 2013. 12. 6. · 4. Thomas Schelling, 3 Une s egr egation se produit 5. Dans la vraie vie 6. ... bootstrap I Lien entre entropie et diversit](https://reader033.fdocuments.us/reader033/viewer/2022051900/5fee80c051a96a79582b5726/html5/thumbnails/3.jpg)
Thomas Schelling
Un economiste errant
I Prix Nobel 2005 for having enhanced our understanding ofconflict and cooperation through game-theory analysis.
Une population aleatoire de rouges et de verts.
3
![Page 4: L2 Vie Arti ciellesebag/Slides/L2V_4.pdf · 2013. 12. 6. · 4. Thomas Schelling, 3 Une s egr egation se produit 5. Dans la vraie vie 6. ... bootstrap I Lien entre entropie et diversit](https://reader033.fdocuments.us/reader033/viewer/2022051900/5fee80c051a96a79582b5726/html5/thumbnails/4.jpg)
Thomas Schelling, 2
Parametres
I Population n
I Voisinage: rayon w
I Seuil de tolerance τ
I Distribution ρ
Regle du jeu
I Si dans votre voisinage, la proportion de gens differents est> τ , partez ! (saut vers une position aleatoire).
4
![Page 5: L2 Vie Arti ciellesebag/Slides/L2V_4.pdf · 2013. 12. 6. · 4. Thomas Schelling, 3 Une s egr egation se produit 5. Dans la vraie vie 6. ... bootstrap I Lien entre entropie et diversit](https://reader033.fdocuments.us/reader033/viewer/2022051900/5fee80c051a96a79582b5726/html5/thumbnails/5.jpg)
Thomas Schelling, 3
Une segregation se produit
5
![Page 6: L2 Vie Arti ciellesebag/Slides/L2V_4.pdf · 2013. 12. 6. · 4. Thomas Schelling, 3 Une s egr egation se produit 5. Dans la vraie vie 6. ... bootstrap I Lien entre entropie et diversit](https://reader033.fdocuments.us/reader033/viewer/2022051900/5fee80c051a96a79582b5726/html5/thumbnails/6.jpg)
Dans la vraie vie
6
![Page 7: L2 Vie Arti ciellesebag/Slides/L2V_4.pdf · 2013. 12. 6. · 4. Thomas Schelling, 3 Une s egr egation se produit 5. Dans la vraie vie 6. ... bootstrap I Lien entre entropie et diversit](https://reader033.fdocuments.us/reader033/viewer/2022051900/5fee80c051a96a79582b5726/html5/thumbnails/7.jpg)
Thomas Schelling, 4
Observer / predire
I Le type de segregation (caracteriser la situation d’equilibre)
I Savoir quand on y arrive (temps de convergence).
7
![Page 8: L2 Vie Arti ciellesebag/Slides/L2V_4.pdf · 2013. 12. 6. · 4. Thomas Schelling, 3 Une s egr egation se produit 5. Dans la vraie vie 6. ... bootstrap I Lien entre entropie et diversit](https://reader033.fdocuments.us/reader033/viewer/2022051900/5fee80c051a96a79582b5726/html5/thumbnails/8.jpg)
Le cas 1D
8
![Page 9: L2 Vie Arti ciellesebag/Slides/L2V_4.pdf · 2013. 12. 6. · 4. Thomas Schelling, 3 Une s egr egation se produit 5. Dans la vraie vie 6. ... bootstrap I Lien entre entropie et diversit](https://reader033.fdocuments.us/reader033/viewer/2022051900/5fee80c051a96a79582b5726/html5/thumbnails/9.jpg)
Le cas du cercle
9
![Page 10: L2 Vie Arti ciellesebag/Slides/L2V_4.pdf · 2013. 12. 6. · 4. Thomas Schelling, 3 Une s egr egation se produit 5. Dans la vraie vie 6. ... bootstrap I Lien entre entropie et diversit](https://reader033.fdocuments.us/reader033/viewer/2022051900/5fee80c051a96a79582b5726/html5/thumbnails/10.jpg)
A propos
I Souvent des logiciels multi-agents (Repast, Net-logo, onlinejava applets)
I Lents !I C++:
I Graphique rapides, OpenGLI Tableaux dynamiques: couteux en tempsI Tableaux statiques: prise en compte des entrees videsI Optimisation du compilateur
10
![Page 11: L2 Vie Arti ciellesebag/Slides/L2V_4.pdf · 2013. 12. 6. · 4. Thomas Schelling, 3 Une s egr egation se produit 5. Dans la vraie vie 6. ... bootstrap I Lien entre entropie et diversit](https://reader033.fdocuments.us/reader033/viewer/2022051900/5fee80c051a96a79582b5726/html5/thumbnails/11.jpg)
Qu’est-ce que c’est ?
1. Systemes dynamiques
2. Structure spatiale
3. Propriete de Markov (d’ordre 1) : i.e. le futur dependuniquement de l’etat courant
4. Pas reversible
5. Beaucoup d’etats stationnaires.
11
![Page 12: L2 Vie Arti ciellesebag/Slides/L2V_4.pdf · 2013. 12. 6. · 4. Thomas Schelling, 3 Une s egr egation se produit 5. Dans la vraie vie 6. ... bootstrap I Lien entre entropie et diversit](https://reader033.fdocuments.us/reader033/viewer/2022051900/5fee80c051a96a79582b5726/html5/thumbnails/12.jpg)
Exemples de resultats
Thm 1Si τ = 1/2, avec une distribution initiale uniforme,en dimension 1, les blocs homogenes sont de longueurpolynomiales en w .
Thm 2Le temps moyen pour arriver a l’equilibre est O(w2)
12
![Page 13: L2 Vie Arti ciellesebag/Slides/L2V_4.pdf · 2013. 12. 6. · 4. Thomas Schelling, 3 Une s egr egation se produit 5. Dans la vraie vie 6. ... bootstrap I Lien entre entropie et diversit](https://reader033.fdocuments.us/reader033/viewer/2022051900/5fee80c051a96a79582b5726/html5/thumbnails/13.jpg)
Quels outils ?
13
![Page 14: L2 Vie Arti ciellesebag/Slides/L2V_4.pdf · 2013. 12. 6. · 4. Thomas Schelling, 3 Une s egr egation se produit 5. Dans la vraie vie 6. ... bootstrap I Lien entre entropie et diversit](https://reader033.fdocuments.us/reader033/viewer/2022051900/5fee80c051a96a79582b5726/html5/thumbnails/14.jpg)
14
![Page 15: L2 Vie Arti ciellesebag/Slides/L2V_4.pdf · 2013. 12. 6. · 4. Thomas Schelling, 3 Une s egr egation se produit 5. Dans la vraie vie 6. ... bootstrap I Lien entre entropie et diversit](https://reader033.fdocuments.us/reader033/viewer/2022051900/5fee80c051a96a79582b5726/html5/thumbnails/15.jpg)
Vie artificielle
Les domaines sont differents
I Physique: modeles d’Ising
I Biologie: morphogenese
I Sociologie/economie
15
![Page 16: L2 Vie Arti ciellesebag/Slides/L2V_4.pdf · 2013. 12. 6. · 4. Thomas Schelling, 3 Une s egr egation se produit 5. Dans la vraie vie 6. ... bootstrap I Lien entre entropie et diversit](https://reader033.fdocuments.us/reader033/viewer/2022051900/5fee80c051a96a79582b5726/html5/thumbnails/16.jpg)
Vie artificielle, 2
Phenomenes similaires:Effets macroscopiques des choix microscopiques
Plus de details
I L’histoire des gauchers
I http://www.youtube.com/watch?v=EbN596buqKo
Credit:George Barmpalias (Chinese Academy of Sciences), Richard Elwes(University of Leeds), Andy Lewis-Pye (London School ofEconomics).
16
![Page 17: L2 Vie Arti ciellesebag/Slides/L2V_4.pdf · 2013. 12. 6. · 4. Thomas Schelling, 3 Une s egr egation se produit 5. Dans la vraie vie 6. ... bootstrap I Lien entre entropie et diversit](https://reader033.fdocuments.us/reader033/viewer/2022051900/5fee80c051a96a79582b5726/html5/thumbnails/17.jpg)
Overview
Automates cellulaires, applications
Robotique evolutionnaireGeneralites
Etat de l’artUn critereEvolutionEvolution et Transfert d’informationExperiences
17
![Page 18: L2 Vie Arti ciellesebag/Slides/L2V_4.pdf · 2013. 12. 6. · 4. Thomas Schelling, 3 Une s egr egation se produit 5. Dans la vraie vie 6. ... bootstrap I Lien entre entropie et diversit](https://reader033.fdocuments.us/reader033/viewer/2022051900/5fee80c051a96a79582b5726/html5/thumbnails/18.jpg)
Contexte: Robotique en essaim
SYMBRION Integrated Project
http://symbrion.org/
18
![Page 19: L2 Vie Arti ciellesebag/Slides/L2V_4.pdf · 2013. 12. 6. · 4. Thomas Schelling, 3 Une s egr egation se produit 5. Dans la vraie vie 6. ... bootstrap I Lien entre entropie et diversit](https://reader033.fdocuments.us/reader033/viewer/2022051900/5fee80c051a96a79582b5726/html5/thumbnails/19.jpg)
Contexte: Robotique en essaim, 2
Objectif et Motivations
1. Robotique Evolutionnaire
2. Apprentissage de controleurautonome
3. Quel critere d’optimisation ?I Optimisable bootstrapI EfficaceI Embarquable
19
![Page 20: L2 Vie Arti ciellesebag/Slides/L2V_4.pdf · 2013. 12. 6. · 4. Thomas Schelling, 3 Une s egr egation se produit 5. Dans la vraie vie 6. ... bootstrap I Lien entre entropie et diversit](https://reader033.fdocuments.us/reader033/viewer/2022051900/5fee80c051a96a79582b5726/html5/thumbnails/20.jpg)
Etat de l’art
I Robotique EvolutionnaireNolfi-Floreano 2000
I Evaluation par simulateur / in situJacobi 96, Lipson et al. 07
I Espaces de rechercheGomez-Miikkulainen 97
I TachesLanzi 00, Godzik et al. 04, Hartland et al. 09
I CriteresLehman-Stanley 08, Mouret-Doncieux 09
20
![Page 21: L2 Vie Arti ciellesebag/Slides/L2V_4.pdf · 2013. 12. 6. · 4. Thomas Schelling, 3 Une s egr egation se produit 5. Dans la vraie vie 6. ... bootstrap I Lien entre entropie et diversit](https://reader033.fdocuments.us/reader033/viewer/2022051900/5fee80c051a96a79582b5726/html5/thumbnails/21.jpg)
Quelle fitness pour la Robotique Evolutionnaire
Dilemme du bootstrap (amorcage)
I fitness precise optimum == comportement voulu.
I optimisable comportement tres mauvais < mauvais.
Approches
I Sequences de fitnessde Garis 90
Harvey et al. 94, Gomez et al. 97
I Diversite Gomez et al. 07.
I Multi-objectif Mouret-Doncieux
09.
21
![Page 22: L2 Vie Arti ciellesebag/Slides/L2V_4.pdf · 2013. 12. 6. · 4. Thomas Schelling, 3 Une s egr egation se produit 5. Dans la vraie vie 6. ... bootstrap I Lien entre entropie et diversit](https://reader033.fdocuments.us/reader033/viewer/2022051900/5fee80c051a96a79582b5726/html5/thumbnails/22.jpg)
Quelle fitness (2)
Resister a l’opportunisme de l’evolution
I Evitement d’obstacles: en restant immobile...
I Vitesse: Aller-retours rapides dans un couloir...
La fitness proposee par Nolfi & Floreano (2001)
F =n∑
i=1
V ∗ (1−∆V ) ∗ (1 + SensorMax)
Quelques autres approches
I Apprentissage par renforcement Sutton et Barto 98
I Apprentissage par imitation Bain-Sammut 95; Billard et al.
05
I AR Inverse Abbeel-Ng 04
I Theorie des jeux Syed-Schapire 07, 08
22
![Page 23: L2 Vie Arti ciellesebag/Slides/L2V_4.pdf · 2013. 12. 6. · 4. Thomas Schelling, 3 Une s egr egation se produit 5. Dans la vraie vie 6. ... bootstrap I Lien entre entropie et diversit](https://reader033.fdocuments.us/reader033/viewer/2022051900/5fee80c051a96a79582b5726/html5/thumbnails/23.jpg)
Le saut de la realite (reality gap)
Apprentissage en simulation (in silico)
I Simulateur du robot/environnement (modele du monde)
I Simulateur cher ou imprecis (ou les deux)
I Modele et bruit des senseurs/moteurs
peaufinage in situ requis Lipson et al. 06
Apprentissage in situ
I Le seul, pour les roboticiens
I Cher en temps (+ risque materiel)
I Pas de verite terrain
I Besoin d’une optimisation frugale (tps, memoire)
23
![Page 24: L2 Vie Arti ciellesebag/Slides/L2V_4.pdf · 2013. 12. 6. · 4. Thomas Schelling, 3 Une s egr egation se produit 5. Dans la vraie vie 6. ... bootstrap I Lien entre entropie et diversit](https://reader033.fdocuments.us/reader033/viewer/2022051900/5fee80c051a96a79582b5726/html5/thumbnails/24.jpg)
Overview
Automates cellulaires, applications
Robotique evolutionnaireGeneralites
Etat de l’artUn critereEvolutionEvolution et Transfert d’informationExperiences
24
![Page 25: L2 Vie Arti ciellesebag/Slides/L2V_4.pdf · 2013. 12. 6. · 4. Thomas Schelling, 3 Une s egr egation se produit 5. Dans la vraie vie 6. ... bootstrap I Lien entre entropie et diversit](https://reader033.fdocuments.us/reader033/viewer/2022051900/5fee80c051a96a79582b5726/html5/thumbnails/25.jpg)
Fitness Entropique
Figure: Trajectoire du robot
Information disponible “forfree”
I Le robot est une sourced’informations.
I Log robotique :
t → sensations[t],moteurs[t]
Log: T pas de temps ×{8 senseurs, 2 moteurs}
25
![Page 26: L2 Vie Arti ciellesebag/Slides/L2V_4.pdf · 2013. 12. 6. · 4. Thomas Schelling, 3 Une s egr egation se produit 5. Dans la vraie vie 6. ... bootstrap I Lien entre entropie et diversit](https://reader033.fdocuments.us/reader033/viewer/2022051900/5fee80c051a96a79582b5726/html5/thumbnails/26.jpg)
Fitness Entropique (2)
ConjectureUn comportement riche ≡ forte diversite des donnees sensori-motrices
Approche
I Fitness: Entropie
I Requis: Discretiser les donnees sensori-motrices
I Algorithme: Clustering
Clusters dans l’espace sensori-moteur
Trajectoire -¿C1C3C6C17C2...
26
![Page 27: L2 Vie Arti ciellesebag/Slides/L2V_4.pdf · 2013. 12. 6. · 4. Thomas Schelling, 3 Une s egr egation se produit 5. Dans la vraie vie 6. ... bootstrap I Lien entre entropie et diversit](https://reader033.fdocuments.us/reader033/viewer/2022051900/5fee80c051a96a79582b5726/html5/thumbnails/27.jpg)
Clustering
k-Means Alg. aleatoire: garder la meilleure solution sur p tirages
1. Tirer k-centres ci (sites de Voronoı)
2. Partitionner les points xt , t ∈ 1 . . .T (cellules de Voronoı)
xt → ci = argmin{d(xt , cj), cj ∈ C}
3. Centre ci → moyenne des xt ds la cellule i
4. Goto 2
ε-Means
1. Init : C = {} Init liste des centres
2. Pour t = 1 to T boucle sur les pointsI ci = argmin{d(xt , cj), cj ∈ C}I si d(xt , ci ) < ε, incrementer n(ci )I sinon, C = C ∪ {xt}; n(xt) = 1 creer un autre centre
27
![Page 28: L2 Vie Arti ciellesebag/Slides/L2V_4.pdf · 2013. 12. 6. · 4. Thomas Schelling, 3 Une s egr egation se produit 5. Dans la vraie vie 6. ... bootstrap I Lien entre entropie et diversit](https://reader033.fdocuments.us/reader033/viewer/2022051900/5fee80c051a96a79582b5726/html5/thumbnails/28.jpg)
Fitness Entropique
Definition
I Controleur X + environnement → Trajectoire Log
I Clustering des donnees du log
I Centre ci → pi = 1T |{xt ∈ Ci}|
F(X ) = −n∑
i=1
pi ∗ log(pi )
Proprietes :
I F croit avec le nombre n de clusters
I pour n donne, F maximale si pi = 1/n
28
![Page 29: L2 Vie Arti ciellesebag/Slides/L2V_4.pdf · 2013. 12. 6. · 4. Thomas Schelling, 3 Une s egr egation se produit 5. Dans la vraie vie 6. ... bootstrap I Lien entre entropie et diversit](https://reader033.fdocuments.us/reader033/viewer/2022051900/5fee80c051a96a79582b5726/html5/thumbnails/29.jpg)
Discussion
Avantages de FI Penalise l’inaction ≡ un seul etat
I Peu sensible au bruit (senseurs, capteurs)
I Favorise la diversite sensori-motrice
Limites
I Recompense comportements periodiques degeneresI Cas k −means:
I Fitness stochastique non reproductible.I pas de garantie sur le volume sensori-moteur explore.
29
![Page 30: L2 Vie Arti ciellesebag/Slides/L2V_4.pdf · 2013. 12. 6. · 4. Thomas Schelling, 3 Une s egr egation se produit 5. Dans la vraie vie 6. ... bootstrap I Lien entre entropie et diversit](https://reader033.fdocuments.us/reader033/viewer/2022051900/5fee80c051a96a79582b5726/html5/thumbnails/30.jpg)
Overview
Automates cellulaires, applications
Robotique evolutionnaireGeneralites
Etat de l’artUn critereEvolutionEvolution et Transfert d’informationExperiences
30
![Page 31: L2 Vie Arti ciellesebag/Slides/L2V_4.pdf · 2013. 12. 6. · 4. Thomas Schelling, 3 Une s egr egation se produit 5. Dans la vraie vie 6. ... bootstrap I Lien entre entropie et diversit](https://reader033.fdocuments.us/reader033/viewer/2022051900/5fee80c051a96a79582b5726/html5/thumbnails/31.jpg)
Evolution darwinienne
seule transmission: genotype
Evolution classique
I Evolution embarquee possible = fitness frugaleI Algorithme (1+5)ES
1. Un parent genere 5 enfants2. Evaluation des 5 enfants3. Nouveau parent: le meilleur (parent, enfants)
Resultats preliminaires
I Si l’arene est assez complexe condition generale...
I Si la duree de vie de l’individu est assez longue,Apparition d’individus competents, explorateurs, bonne survie du robot
31
![Page 32: L2 Vie Arti ciellesebag/Slides/L2V_4.pdf · 2013. 12. 6. · 4. Thomas Schelling, 3 Une s egr egation se produit 5. Dans la vraie vie 6. ... bootstrap I Lien entre entropie et diversit](https://reader033.fdocuments.us/reader033/viewer/2022051900/5fee80c051a96a79582b5726/html5/thumbnails/32.jpg)
Evolution ”culturelle”transmission: genotype + experience
Capitalisation des acquis
I Experience d’un controleur → les centres des clusters
I Information frugale : peut etre transmise aux enfants
I Condition: info reproductible ε-Means
Fitness ”culturelle”
I Etant donne l’histoire du passe liste des (ci , pi )
I Lancer ε-Means (C = {ci}, log(controleur X courant))
I Mise a jour de pi
I F mesure l’apport d’information par rapport au passe:
F(X ) = IQ(pi )
I Recompense le fait de trouver de nouveaux etats, ou visiter unensemble d’etats rares
32
![Page 33: L2 Vie Arti ciellesebag/Slides/L2V_4.pdf · 2013. 12. 6. · 4. Thomas Schelling, 3 Une s egr egation se produit 5. Dans la vraie vie 6. ... bootstrap I Lien entre entropie et diversit](https://reader033.fdocuments.us/reader033/viewer/2022051900/5fee80c051a96a79582b5726/html5/thumbnails/33.jpg)
Overview
Automates cellulaires, applications
Robotique evolutionnaireGeneralites
Etat de l’artUn critereEvolutionEvolution et Transfert d’informationExperiences
33
![Page 34: L2 Vie Arti ciellesebag/Slides/L2V_4.pdf · 2013. 12. 6. · 4. Thomas Schelling, 3 Une s egr egation se produit 5. Dans la vraie vie 6. ... bootstrap I Lien entre entropie et diversit](https://reader033.fdocuments.us/reader033/viewer/2022051900/5fee80c051a96a79582b5726/html5/thumbnails/34.jpg)
Validation Experimentale
Objectifs de l’experimentation
I Tester F : frugalite, resistance au bruit, surmonter le pb debootstrap
I Lien entre entropie et diversite descontroleurs/comportements,
I Lien entre entropie et exploration de l’environnement
I Les bons individus exhibent-ils des comportementsinteressants ?
Etude de sensibilite
I Impact de la fitness (individuelle ou avec passe)
I Impact de l’environnement (simple ou complexe)
34
![Page 35: L2 Vie Arti ciellesebag/Slides/L2V_4.pdf · 2013. 12. 6. · 4. Thomas Schelling, 3 Une s egr egation se produit 5. Dans la vraie vie 6. ... bootstrap I Lien entre entropie et diversit](https://reader033.fdocuments.us/reader033/viewer/2022051900/5fee80c051a96a79582b5726/html5/thumbnails/35.jpg)
Protocole experimental
Espace de recherche: reseaux de neurones
I 8 entrees, 2 sorties
I 1 couche cachee
I Init: poids ds [-1,1]
Deux arenes: 1 simple, 1 complexe
Resultat: moyenne sur 15 runs independants.
35
![Page 36: L2 Vie Arti ciellesebag/Slides/L2V_4.pdf · 2013. 12. 6. · 4. Thomas Schelling, 3 Une s egr egation se produit 5. Dans la vraie vie 6. ... bootstrap I Lien entre entropie et diversit](https://reader033.fdocuments.us/reader033/viewer/2022051900/5fee80c051a96a79582b5726/html5/thumbnails/36.jpg)
Evolution darwinienne, k-MeansFitness individuelle: pas de passe
Figure: k=15, arene simple Figure: k=30, arene complexe
Trajectoires d’individus representatifs apres 200 generations.
Commentaires
I Clustering k-Means et ε-Means comparables
I Complexite environnement : facteur favorable
I Ajuster k et ε36
![Page 37: L2 Vie Arti ciellesebag/Slides/L2V_4.pdf · 2013. 12. 6. · 4. Thomas Schelling, 3 Une s egr egation se produit 5. Dans la vraie vie 6. ... bootstrap I Lien entre entropie et diversit](https://reader033.fdocuments.us/reader033/viewer/2022051900/5fee80c051a96a79582b5726/html5/thumbnails/37.jpg)
Evolution culturelle
Evolution des decouvertesAbscisse: cluster/etats (ordonnes par instant de decouverte)Une ligne: un individu: etats visites
Influence de ε
I Augmentation exponentielle du nombre d’etats avec ε
I ε: trop grand ou trop petit, penalise l’evolutiontout se ressemble, tout est different
37
![Page 38: L2 Vie Arti ciellesebag/Slides/L2V_4.pdf · 2013. 12. 6. · 4. Thomas Schelling, 3 Une s egr egation se produit 5. Dans la vraie vie 6. ... bootstrap I Lien entre entropie et diversit](https://reader033.fdocuments.us/reader033/viewer/2022051900/5fee80c051a96a79582b5726/html5/thumbnails/38.jpg)
Evolution culturelle (2)
Exploration de l’arene
apres 50 gen. apres 200 gen.Zones noires: non visitees zones d’obstacles
Les robots vont partout: exploration collective
38
![Page 39: L2 Vie Arti ciellesebag/Slides/L2V_4.pdf · 2013. 12. 6. · 4. Thomas Schelling, 3 Une s egr egation se produit 5. Dans la vraie vie 6. ... bootstrap I Lien entre entropie et diversit](https://reader033.fdocuments.us/reader033/viewer/2022051900/5fee80c051a96a79582b5726/html5/thumbnails/39.jpg)
Validation
Protocole experimentalRobot = Cortex M3, 8 infra-red sensors, 2 motors.Controleurs = Multi-layer Perceptron, 10 neurones caches.
Deux arenes (moyenne et dure)
13
/04
/10
, 1
3:1
5,
mic
hele
, fi
ch
: M
ed
ium
_fr
am
e
100 300 500 700 900
100
300
500
24
/04
/10
, 0
2:3
1,
mic
hele
, fi
ch
: H
ard
_fr
am
e
100 300 500 700
100
300
500
700
39
![Page 40: L2 Vie Arti ciellesebag/Slides/L2V_4.pdf · 2013. 12. 6. · 4. Thomas Schelling, 3 Une s egr egation se produit 5. Dans la vraie vie 6. ... bootstrap I Lien entre entropie et diversit](https://reader033.fdocuments.us/reader033/viewer/2022051900/5fee80c051a96a79582b5726/html5/thumbnails/40.jpg)
Validation, 2
Plot points visites 10 fois ou plus par les meilleurs 100 individus.
PPSN 2010
40
![Page 41: L2 Vie Arti ciellesebag/Slides/L2V_4.pdf · 2013. 12. 6. · 4. Thomas Schelling, 3 Une s egr egation se produit 5. Dans la vraie vie 6. ... bootstrap I Lien entre entropie et diversit](https://reader033.fdocuments.us/reader033/viewer/2022051900/5fee80c051a96a79582b5726/html5/thumbnails/41.jpg)
Discussion
The approach fits the requirements: computable on-board forswarm robot architecture; no need of prior knowledge/groundtruth.The robot only aims at gathering information, as opposed to,building a world model. (unsupervised as opposed to supervisedlearning).The robot is rewarded for what it gets (sensory information) notwhat it does (e.g. going fast and not circling).
Caveat: needs a stimulating environment.
41
![Page 42: L2 Vie Arti ciellesebag/Slides/L2V_4.pdf · 2013. 12. 6. · 4. Thomas Schelling, 3 Une s egr egation se produit 5. Dans la vraie vie 6. ... bootstrap I Lien entre entropie et diversit](https://reader033.fdocuments.us/reader033/viewer/2022051900/5fee80c051a96a79582b5726/html5/thumbnails/42.jpg)
Vision and Perspectives
Requirements
X No simulation
X On-board trainingI Frugal (computation, memory)I No ground truth
? Providing “interesting results”
Human Robot Interaction
I Sensori-motor states can be interpreted, enabling the designerto take control, e.g. for emergency situations.
I Display trajectories: The designer can emit preferencesInteractive optimization
Preference learning: associate “values” to sensori-motor states
42