近日,我院青年教师王巍老师与天津大学穆朝絮教授团队、武汉工程大学黄自鑫教授合作发表论文《Q-learning based tracking control with novel finite-horizon performance index》,论文发表于中国科学院一区期刊《Information Sciences》(A类),王巍老师为该论文的第一作者。
论文提出了一种创新的有限时域性能指标,用于解决未知线性离散系统的模型无关最优跟踪控制难题。通过巧妙设计仅依赖下一步跟踪误差的新型性能指标,结合Q学习算法。仿真实验表明,该方法在跟踪速度上优于传统无限时域方法。这项研究为有限时域最优控制任务提供了新的解决方案。