Multiagent Systems

46
Multiagent Systems Einführung: Kommunikation Multiagent Systems: A Survey from a Machine Learning Perspective [Peter Stone, Manuela Veloso 2000] Computation Intelligence Seminar A Helmut GRABNER

description

Computation Intelligence Seminar A Helmut GRABNER. Multiagent Systems. Einführung: Kommunikation Multiagent Systems: A Survey from a Machine Learning Perspective [Peter Stone, Manuela Veloso 2000]. Übersicht. Kurze Wiederholung Homogeneous Communication MA - PowerPoint PPT Presentation

Transcript of Multiagent Systems

Page 1: Multiagent Systems

Multiagent Systems

Einführung: Kommunikation

Multiagent Systems: A Survey from a Machine Learning Perspective[Peter Stone, Manuela Veloso 2000]

Computation Intelligence Seminar AHelmut GRABNER

Page 2: Multiagent Systems

Übersicht Kurze Wiederholung Homogeneous Communication MA

Beispiel: Reaktives Multiagentensystem

Heterogeneous Communication MA Interaktionen

Multiagent Q-Learning

Page 3: Multiagent Systems

Wiederholung - Einteilung

Page 4: Multiagent Systems

Homogeneous Communicating Multiagent Systems

Page 5: Multiagent Systems

Homogeneous Communicating Multiagent Systems

Allgemein Agenten können

direkt (!) miteinander kommunizieren

gleicher Aufbau, nur Input variiert

Page 6: Multiagent Systems

Homogeneous Communicating Multiagent Systems

Beispiel: Pursuit domain [Stephen, Merx

1990] Kommunikation

um sicherzustellen, dass jeder an eine andere „Capture-Pos.“ fährt. (vgl. Homogeneous no communication.)

Page 7: Multiagent Systems

Homogeneous Communicating Multiagent Systems

Aufgaben/Fragen Aufgaben

Verteiltes erfassen von Informationen Trafficopter

Fragen Was, wann, wie und mit wem soll

kommuniziert werden? Sensorinformationen/Ziele

Page 8: Multiagent Systems

Homogeneous Communicating Multiagent Systems

Reaktives Multiagentensystem

Beispiel

Communication in Reactive Multiagent Robotic Systems[Balch, Arkin 1994]

Page 9: Multiagent Systems

Beispiel: Reaktives Multiagentensystem

Inhalt Kommunikationsmethoden

no communication State communication Goal communication

Aufgaben Futtersuche (Forage – Task) Abgrasen (Graze – Task)

Umgebung 2D, Roboter, Hindernisse, Arttraktoren

Zusammenfassung

Page 10: Multiagent Systems

Beispiel: Reaktives Multiagentensystem - Kommunikationsmethode

No communication Agent (Roboter) als Automat keine direkte Kommunikation, Jeder

Agent ist auf seine Wahrnehmung der Welt beschränkt

Unterscheidungen: andere Agenten (Roboter), Arttraktoren, Hindernisse

Page 11: Multiagent Systems

Beispiel: Reaktives Multiagentensystem - Kommunikationsmethode

State Communication Kein direktes Senden, andere

können den Zustand aber abfragen Agenten erkennen den Status

eines anderen Agent hat „Arbeit“ gefunden

Agent fährt zu demjenigen

Page 12: Multiagent Systems

Beispiel: Reaktives Multiagentensystem - Kommunikationsmethode

Goal Communication Explizite Kommunikation

Position des Arttraktors Sender – Übertragung – Empfänger

Biologie: Honigbiene – Tanz Roboter fährt direkt zum Arttraktor

eventuell kürzerer Weg

Page 13: Multiagent Systems

Beispiel: Reaktives Multiagentensystem - Aufgabe

Forage-Task Roboter sucht die Umgebung

nach „Futter“ (Arttraktoren) ab und bringt diese „nach Hause“

Hindernisse in der Umgebung

Die Masse eines Arttraktors bestimmt, wie schnell er transportiert werden kann. Mehrere Roboter gemeinsam können dies beschleunigen.

Page 14: Multiagent Systems

Beispiel: Reaktives Multiagentensystem – Aufgabe Forage-Task

Kommunikationsmethoden No

communication Automat

State und Goal communication

Realisiert mit 1 Bit: „Suchen“ oder „hinbewegen“ / „nach Hause“

Page 15: Multiagent Systems

Beispiel: Reaktives Multiagentensystem – Aufgabe Forage-

Task Vergleiche

5145 Schritte 4470 Schritte 3495 Schritte

Page 16: Multiagent Systems

Beispiel: Reaktives Multiagentensystem – Aufgabe Forage-Task

Vergleichsmaß Roboter (1..5) x

Arttraktoren (1..7) Steps (Zeitschritte)

Vergleich (Division) der beiden Messungen

(Speedup Vergleich) Mittelwert

Page 17: Multiagent Systems

Beispiel: Reaktives Multiagentensystem – Aufgabe Forage-

Task Auswertung

Forage - Task Verbesserung

Mittelwert beste schlechteste

State vs. no 16 % 66 % -5 %

Goal vs. no 19 % 59 % -7 %

Goal vs. State 3 % 34 % -19 %

Page 18: Multiagent Systems

Beispiel: Reaktives Multiagentensystem – Aufgabe

Graze-Task „Abgrasen“ der

gesamten Umgebung Hindernisse in der

Umgebung

Page 19: Multiagent Systems

Beispiel: Reaktives Multiagentensystem – Aufgabe Graze-Task

Kommunikationsmethoden No

communication Automat

State und Goal communication

Realisiert mit 1 Bit: „Suchen“ oder „hinbewegen“ / „weiden“

Page 20: Multiagent Systems

Beispiel: Reaktives Multiagentensystem – Aufgabe Graze-Task

Auswertung

Kommunikation bringt fasst nichts Wenn der Roboter „grast“ hinterlässt er unvermeidlich

eine „Spur“ -> Diese Änderung der Umgebung kann als indirekte Kommunikation verstanden werden!

Graze - Task Verbesserung

Mittelwert beste schlechteste

State vs. no 1 % 19 % 0 %

Goal vs. no 1 % 19 % 0 %

Goal vs. State 0 % 0 % 0 %

Page 21: Multiagent Systems

Beispiel: Reaktives Multiagentensystem

Zusammenfassung Kommunikation bringt viel, bei

Anwendungen mit wenig impliziter Kommunikation (Forage)

Kommunikation ist nicht notwendig, bei Anwendungen wo (viel) implizite Information vorhanden ist.

Komplexere Kommunikationsstrategien bringen relativ kleinen Gewinn

Page 22: Multiagent Systems

Heterogeneous Communicating Multiagent Systems

Page 23: Multiagent Systems

Heterogeneous Communicating Multiagent Systems

Allgemein Verschieden auf

jegliche Art sehr komplex und

leistungsstark (allgemeinster Fall)

Wohlwollend vs. Wettbewerb

Page 24: Multiagent Systems

Heterogeneous Communicating Multiagent Systems

Beispiel: Pursuit domain Extremfall:

Ein „intelligenter“ Agent steuert mehrere ausführende (single agent)

Page 25: Multiagent Systems

Untereinander verstehen Wohlwollend vs. Wettbewerb

Trainer

Verhandlungen Temperaturkontrolle

Verpflichtungen Ressource Management

Heterogeneous Communicating Multiagent Systems

Aufgaben/Fragen

Page 26: Multiagent Systems

Interaktion

Page 27: Multiagent Systems

Interaktion

Wozu? Möglichkeit zur Abstimmung von

Aktionen Alternative: vollständige wechselseitige

Modellierung bei homogenen: Modell der internen

Zustände bei heterogenen: Komplizierter - Ziel,

Aktionen, Wissen der anderen Agenten sind möglicherweise nicht bekannt und müssen durch Beobachtung modelliert werden.

Page 28: Multiagent Systems

Interaktion Ziele Maximieren des Gesamtergebnisses

Sicherstellung des Bestehens und der Leistungsfähigkeit des Gesamtsystems

Arbeitsteilung (Bestimmung gemeinsamer Ziele/Aufgaben)

Vermeidung von Redundanzen Abhängigkeiten der Aktionen der einzelnen Agenten

(Reihenfolge) Behandlung von Interferenzen und Konflikten

(„widersprüchliche“ Ziele) Vermeidung unnötiger Konflikte Kombination unterschiedlichen Wissens Erfüllungen von Nebenbedingungen (z.B. begrenzte

Ressourcen)

Page 29: Multiagent Systems

Interaktion

Wie? Speech acts

Kommunizieren mittels Aktionen

Kommunikation „extra - Environment“

?

Page 30: Multiagent Systems

Interaktion

Begriffe

Interaktion: Wechselbeziehung, bes. die Kommunikation zw. Individuen innerhalb einer Gruppe. Kommunikation: Prozess der Mitteilung; der wechselseitige Austausch von Gedanken, Meinungen, Wissen, Erfahrungen und Gefühlen sowie die Übertragung von Nachrichten und Informationen

Koordination: Abstimmen verschiedener VorgängeKooperation: ZusammenarbeitKonkurrenz: Wettbewerb

Page 31: Multiagent Systems

Interaktion

Agenteninteraktion Kommunikation (communication)

Verständigung mehrerer Agenten untereinander Koordination (coordination)

jene Kommunikation welche zur aufgabenbezogenen Tätigkeit notwendig ist

Kooperation (cooperation) jene Kommunikation welche zur Koordination und

Vereinbarung gemeinsamer Ziele notwenig ist Verhandlung (negotiation)

jene Kommunikation für die Aushandlung der Kompromisse

Page 32: Multiagent Systems

Interaktion

Kommunikationstypen keine Kommunikation indirekte Kommunikation

Austausch von Information über einen gemeinsamen Informationsraum (Umwelt)

einfache Kommunikation individueller Austausch von einfachen Nachrichten

bzw. Ereignissen Kommunikation basierend auf Konversation

Austausch von strukturierten Nachrichten Konversationstheorie: Äußerungen werden mit

Handlung gleichgesetzt (Sprechen ist eine Art Aktion) und wie sie die Zukunft verändern (Ich verurteile Sie zu...)

Page 33: Multiagent Systems

Interaktion

Agentenkommunikation Voraussetzungen für erfolgreiche

Kommunikation (heterogene Agenten)

Gemeinsame Ontologie Gemeinsame Begriffsmenge (Vokabular) Gemeinsame Semantik für diese Begriffe

Gemeinsame Kommunikationssprache in Syntax und Semantik

Technische Voraussetzungen (Übertragungskanäle,..)

Page 34: Multiagent Systems

Interaktion

Knowledge Interchange Format (KIF)

Zwischensprache zur Übersetzung einer Wissensbasis von einer Repräsentation zu einer anderen.

Muss mächtig genug sein, um alle in der Sprache formierten Wissensinhalte zu transportieren

Deklarative Semantik Bedeutung von Ausdrücken mittels Interpretation

über Modelle (logisch verwertbar) (Common Lisp ähnlich)

Page 35: Multiagent Systems

Interaktion

Knowledge Query and Manipulation Language (KQML)

spezifiziert ein Nachrichtenformat zum Austausch von Informationen

Nachricht wird in eine Struktur gebracht, die von jedem Agenten verstanden wird. Die Nachricht selbst jedoch muss nicht unbedingt verstanden werden.

3 Ebenen Inhaltsebene

aktueller Nachrichteninhalt (z.B.: in KIF) Nachrichtenebene

spezifiziert den Nachrichtentyp/Nachrichtenparameter (Fragen, Mitteilen, „tu was“, Benachrichtigen,...)

Kommunikationsebene Sender/Empfänger

Page 36: Multiagent Systems

Interaktion

Simple Knowledge Transfer Protocol (SKTP)

contentSKTPmessage

communication

application

ISO/OSI

presentation

session

transport

network

data link

physical

Inhaltsebene(content Layer)Inhalt der Nachricht. Das in „Wörtern“ ausgedrückte „Wissen“

Nachrichteneben(message Layer)Nachrichtentyp, Thema der Nachricht

Kommunikationsebene(communication Layer)Daten aus der KQML Nachricht für die Datenübertragung (Adressen)

Page 37: Multiagent Systems

Interaktion

Beispiel: KQML

(ask-one: sender helmut: receiver boerse_server : replay-with euro_kurs: content (WERT EURO_DOLLAR ?wert): language Prolog: ontology Boerse)

(tell: sender boerse_server: receiver helmut: in-replay-to euro_kurs: content (WERT EURO_DOLLAR 1.0029): language Prolog: ontology Boerse)

NachrichtenebeneKommunikationsebeneInhaltseben

Nachrichtentypen:Anfragen: ask-one, ask-all,...Antworten: replay, sorry,...Informationsverm.: tell,...Funktionsangebot: advertiese,...Zustand: ready, standby,...

Page 38: Multiagent Systems

Interaktion

Koordination von Agenten Welcher Agent soll was machen –

Verteilte Künstliche Intelligenz Kooperation

Notwendig? Selbstsüchtig Delegieren von Aufgaben (hierarchische Strukturen)

Konkurrenz Marktmechanismus

Gegenseitige Kooperation (Abmachungen) Manager - mehrere Anbieter

keine zentrale Kontrolle jeder Partner evaluiert Information aus seinem

Standpunkt

Page 39: Multiagent Systems

Interaktion

Koordinationsvarianten direkter Nachrichtenaustausch (point to point)

message parsing Klassisch: Verbindungsarten (Client/Server),

Protokolle, Synchronisation,... Blackboard (broadcast)

Verwendung von gemeinsamen Datenstrukturen (shared memory)

Agent entscheidet wann und was er bekannt gibt und ob er wann und welche Informationen sucht und diese bewertet

Synchron und Asynchron Meeting

Page 40: Multiagent Systems

Multiagent Q-Learning

Beispiel für die Komplexität, ohne

Theorie

Multiagent Q-Learning[Hu, Wellmann 2002]

Page 41: Multiagent Systems

Multiagent Q-Learning

Multiagent Q-Learning Was soll in dem aktuellen Zustand

gemacht werden? Join Action Values

Ein Agent muss n Q-Tables (eine für ihn und je eine für die anderen Agenten - Modellierung) erstellen

Page 42: Multiagent Systems

Multiagent Q-Learning

Singleagent vs. Multiagent

Singleagent Multiagent

Q-Function

Optimal Q-value aktueller Reward + zukünftige Rewards wenn die optimale Strategie verwendet wird

aktueller Reward + zukünftige Rewards wenn alle Agenten die optimale Strategie (Nash-Gleichgewicht) verwenden werden

)a,s(Q )a,...a,s(Q n1

Page 43: Multiagent Systems

Multiagent Q-Learning

Beispiel Agent 1 und Agent

2 jeweils in die diagonale Ecke

Gewinner: der als erster angekommen ist (oder beide zugleich – Ziel)

kein Zusammenstoß

Page 44: Multiagent Systems

Beispiel: Multiagent Q-Learning

States,... States: 9 x 9

Anfangszustand (0, 2) Aktionen: 4 Q Table: 81 x 4 = 324

Page 45: Multiagent Systems

Beispiel: Multiagent Q-Learning

Ergebnis

Spieltheorie Nash Gleichgewicht

Wie kann Kooperation aus Handlungen von Egoisten entstehen?

Bimatrix-game (Gefangenen Dilemma)

im Zustand(0, 2)

Agent 2

Links Hinauf

Agent 1Recht

s86, 87 83, 85

Hinauf

96, 91 95, 95

Page 46: Multiagent Systems

Multiagent Q-Learning

Komplexität m = Anzahl der Zustände n = Anzahl der Agenten A = möglichen Aktionen Ein Agent muss n Q – Functions

lernen! nAmn