ut s OpenAI + DotA 2kanmy/courses/6101_1820/s13.pdf · ut s OpenAI Rapid[1] … a general-purpose...

Wism

ut

Labs

OpenAI + DotA 2

Wism

ut

Labs

DotA (Defense of the Ancients) 2 Gameplay

•

•

•

•

•

•

•

https://www.youtube.com/watch?v=UZHTNBMAfAA

Wism

ut

Labs

DotA and StarCraft II Challenges [1, 2, 3]

• → →

•

•

•

•

Wism

ut

Labs

OpenAI DotA Progress Summary [1]

•

•

•

•

•

•

•

•

•

•

•

•

•

•

https://arena.openai.com/

Wism

ut

Labs

OpenAI DotA Approach [1]

•

•

•

•

•

γ

•

Wism

ut

Labs

OpenAI DotA ‘Cheats’ [1, 3]

•

• →

•

•

•

•

•

• →

•

•

Wism

ut

Labs

OpenAI Five Network Architecture [1, 6]

Wism

ut

Labs

OpenAI Five Model Structure [1]

•

•

•

•

•

•

•

•

•

•

https://openai.com/blog/openai-five/#modelstructure

Wism

ut

Labs

OpenAI Five Exploration [1]

•

•

• →

•

•

• →

→

•

•

•

Wism

ut

Labs

OpenAI Rapid [1]… a general-purpose RL training system

•

•

•

•

•

•

•

•

•

→

https://github.com/openai/gym

Wism

ut

Labs

Proximal Policy Optimization [1, 4, 5]

•

• →

• →

•

•

→

Wism

ut

Labs


•

•

•

•

• →

Wism

ut

Labs


•

•

•

• →

•

•

→

Wism

ut

Labs


•

•

•

•

•

•

• →

Wism

ut

Labs


•

• →

•

Wism

ut

Labs


•

•

•

Wism

ut

Labs


•

→

Wism

ut

Labs

Transfer Learning for RL [1]

•

•

•

→

Wism

ut

Labs

Open Challenges & Moving Forward

•

•

•

•

•

Wism

ut

Labs

Reference Materials

https://openai.com/blog/

https://deepmind.com/blog/alphastar-mastering-real-time-strategy-game-starcraft-ii/

https://www.skynettoday.com/editorials/openai-dm

http://arxiv.org/abs/1707.06347

https://medium.com/@jonathan_hui/rl-proximal-policy-optimization-ppo-explained-77f014ec3f12

https://neuro.cs.ut.ee/the-use-of-embeddings-in-openai-five/

ut s OpenAI + DotA 2kanmy/courses/6101_1820/s13.pdf · ut s OpenAI Rapid[1] … a general-purpose...

Documents

Transcript of ut s OpenAI + DotA 2kanmy/courses/6101_1820/s13.pdf · ut s OpenAI Rapid[1] … a general-purpose...