基于Policy Gradient的机械臂运动跟踪控制器参数整定

Systems Engineering and Electronics(2021)

引用 0|浏览0
暂无评分
摘要
针对机械臂运动跟踪控制器的参数自整定问题,设计了一种基于强化学习Policy Gradient法的参数整定器.首先,介绍了机械臂的一种混合动力学模型,根据该系统模型进行了比例-微分(proportional-derivative,PD)控制器设计和李雅普诺夫稳定性证明,并由此给出了参数矩阵的范围.其次,设计了基于Policy Gradient的参数整定器,通过引入积分器的方法对其进行改进,使其控制下的参数行为连续化以进一步提高PD控制器的控制效果.最后,以二阶机械臂系统为例进行了仿真验证.实验数据证明了该参数整定器的有效性和可行性,并能有效提升系统的动态性能.
更多
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要