Introduction Examples Basic Categories 多智能体合作:全队分享奖励 简单来说,就是多智能体协调问题 举例:无人机阵列 多智能体竞争:所有人有各自的奖励 完全利己主义 零和博弈,纳什均衡 混合合作博弈 平衡团队回报以及个人汇报 举例:游戏竞技中,首先团队需要获胜,其次自己最好是 MVP 范例 合作多智能体 模型 MA-MDP Dec-POMDP 算法 线性值分解 RIIT