多智能体强化学习近年来,随着强化学习在多个应用领域取得了令人瞩目的成果,并且考虑到在现实场景中通常会同时存在多个决策个体(智能体),部分研究者逐渐将眼光从单智能体领域延伸到多智能体,即多智能体强化学习(multi-agent reinforcement learning)。当同时存在多个智能体与环境交互时,整个系统就变成一个多智能体系统。每个智能体仍然是遵循着强化学习的目标,也就是是最大化能够获得的累积回报,而此时环境全局状态的改变就和所有智能体的联合动作相关了。因此在智能体策略学习的过程中,需要考虑联合动作的影响。
无数据, 请查看其它