深度强化学习Memetic算法求解取送货车辆路径问题

ZHOU Yalan, LIAO Yitian, SU Xiao,WANG Jiahai

Journal of Frontiers of Computer Science & Technology(2024)

引用 0|浏览4
暂无评分
摘要
带时间窗约束的同时取送货车辆路径问题(VRPSPDTW)是NP难问题,属于约束较复杂的车辆路径问题,在现代物流中有广泛应用.提出深度强化学习Memetic算法求解该问题,将Memetic算法求解VRPSPDTW问题中的大邻域搜索过程建模成马尔可夫决策过程,构建编码器-解码器架构的深度神经网络模型完成大邻域搜索中的移除操作.编码器对当前解中各结点的个体特征和位置特征进行信息交互,解码器输出需要移除的结点,设计了非自回归和自回归两种网络结构,采用强化学习算法训练神经网络模型.设计了混合策略,将人工设计的启发式策略与深度强化学习到的策略相结合,以提高寻优能力.实验结果显示提出的算法具有更强的跳出局部最优的能力,能在有效的时间内获得比对比算法更优的解,特别是在大规模问题上.最后,对提出算法的新组件进行了消融实验,证明了算法的有效性.
更多
查看译文
关键词
simultaneous pickup-delivery vehicle routing problem,time window,deep reinforcement learning,large neighborhood search
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要