Skip to content

Introduction

Examples

Basic Categories

  1. 多智能体合作:全队分享奖励
    • 简单来说,就是多智能体协调问题
    • 举例:无人机阵列
  2. 多智能体竞争:所有人有各自的奖励
    • 完全利己主义
    • 零和博弈,纳什均衡
  3. 混合合作博弈
    • 平衡团队回报以及个人汇报
    • 举例:游戏竞技中,首先团队需要获胜,其次自己最好是 MVP

范例

合作多智能体

模型

MA-MDP

Dec-POMDP

算法

线性值分解

RIIT