基于近似动态规划的数据驱动非线性多输入多输出在线优化与控制算法
批准号:
61403250
项目类别:
青年科学基金项目
资助金额:
24.0 万元
负责人:
黄志坚
依托单位:
学科分类:
F0301.控制理论与技术
结题年份:
2017
批准年份:
2014
项目状态:
已结题
项目参与者:
陈文涛、张琴、武起立、杨智远、谭亲明、钟庆源、杨鹏飞
国基评审专家1V1指导 中标率高出同行96.8%
结合最新热点,提供专业选题建议
深度指导申报书撰写,确保创新可行
指导项目中标800+,快速提高中标率
微信扫码咨询
中文摘要
随着海洋科学、航空航天、能源化工、生物医学以及管理科学等的发展,许多复杂系统面临着优化与控制的难题。近似动态规划解决了动态规划的维数灾问题,是近年来兴起的一种近似优化新解法。本项目基于优化系统的分析,首次针对非线性多输入多输出结构、在线学习、以及数据驱动这三个集中需求的一个综合问题,在一个新的层次上研究近似动态规划的结构与方法,并提出其学习算法。研究围绕以下四个方面展开:1)基于拓扑原理构建非线性多输入多输出近似动态规划的结构;2)采用数据驱动K近邻方法逼近近似动态规划多维输入评价模块的代价函数;3)面向指数收敛性能计算近似动态规划执行模块的多输出策略迭代;4)评价与执行模块的同步学习及其在线优化与控制。为实现基于近似动态规划的数据驱动非线性多输入多输出在线优化与控制奠定理论及应用基础;这也是上述很多科学和工程领域在优化控制、人工智能、节能减排、决策支持以及运筹管理等方面的一致需求与共识。
英文摘要
With the development of marine science, aerospace, energy chemical industry, biomedical and management science etc., many complex systems are facing with optimization and control problems. The approximate dynamic programming solves the "curse of dimensionality" problem of dynamic programming, which is an emerging method for solving optimization and control in recent years. This project, based on analysis of optimal systems, researches the structures and methods of approximate dynamic programming and presents its algorithm, firstly focusing on an integrated problem of three demands on nonlinear multi-input multi-output structure, online learning and data driven method. The research is carried out from the following four aspects: 1) the structure topology of nonlinear multi-input multi-output approximate dynamic programming based on topology principle; 2) the local average approximation to the cost function of the critic module of approximate dynamic programming adopting data-driven K-Nearest Neighbor approach; 3) the policy iteration calculation of the multi-output action module of approximate dynamic programming with a exponential convergence performance; 4) the synchronous learning of the critic and action modules and their online optimization and control. This research will lay a theoretical and applied foundation for data-drive nonlinear multi-input multi-output online optimization and control based on approximate dynamic programming. The research is also a consistent demand and consensus for the above science and engineering areas in optimal control, artificial intelligence, energy conservation, decision support and logistics management as well as other aspects.
随着海洋科学、航空航天、能源化工、生物医学以及管理科学等的发展,许多复杂系统面临着优化与控制的难题。近似动态规划解决了动态规划的维数灾问题,是近年来兴起的一种近似优化新解法。本项目基于优化系统的分析,首次针对非线性多输入多输出结构、在线学习、以及数据驱动这三个集中需求的一个综合问题,在一个新的层次上研究近似动态规划的结构与方法,并提出其学习算法。. 研究围绕以下四个方面展开:1)基于拓扑原理构建非线性多输入多输出近似动态规划的结构。2)采用数据驱动K近邻方法逼近近似动态规划多维输入评价模块的代价函数。3)面向指数收敛性能计算近似动态规划执行模块的多输出策略迭代。4)评价与执行模块的同步学习及其在线优化与控制。. 结果:1)构建出四种非线性多输入多输出的近似动态规划结构,即执行网络扩展方法、子网方法、级联执行网络方法、组合方法。论证了其梯度下降训练算法不满足复合矩阵/向量对标量求导的链式法则,并给出解决方案和该四种方法的算法公式。 2)采用K近邻方法逼近评价网络的值函数,以克服神经网络的固有缺点,获得良好数据驱动能力;采用神经网络逼近执行网络控制输出,以获得非线性和多输入多输出性能,并添加持续激励信号,以逼近指数收敛;得出混合方法的近似动态规划。3)采用Lyapunov稳定理论,证明了在二次型、平方加权和、绝对值/模之和的效用函数下,非线性多输入多输出近似动态规划具有稳定与收敛性能。4)基于二次型形式逼近评价网络值函数,多输入多输出ADRC解耦控制逼近执行网络控制输出系数,得出一种不采用神经网络的在线数据驱动非线性多输入多输出近似动态规划方法。并以发动机缸平衡和水下热滑翔机姿态调节的优化控制为例,验证其优化与控制效果。. 研究结果为实现基于近似动态规划的数据驱动非线性多输入多输出在线优化与控制奠定理论及应用基础;这也是上述很多科学和工程领域在优化控制、人工智能、节能减排、决策支持以及运筹管理等方面的一致需求与共识。
期刊论文列表
专著列表
科研奖励列表
会议论文列表
专利列表
DOI:10.1002/oca.2381
发表时间:2018
期刊:Optimal Control Applications & Methods,
影响因子:--
作者:Huang Zhijian;Li Yudong;Zhang Cheng;Wu Gang;Liu Yihua;Chen Yuli
通讯作者:Chen Yuli
DOI:--
发表时间:2017
期刊:上海海事大学学报
影响因子:--
作者:黄志坚;熊雪梅;张赞;李宇栋;陈文涛;张琴
通讯作者:张琴
Three bounded proofs for nonlinear multi-input multi-output approximate dynamic programming based on the Lyapunov stability theory
基于Lyapunov稳定性理论的非线性多输入多输出近似动态规划的三个有界证明
DOI:10.1002/oca.2332
发表时间:2018
期刊:OPTIMAL CONTROL APPLICATIONS & METHODS
影响因子:1.8
作者:Zhijian Huang;Xuemei Xiong;Wentao Chen;Qin Zhang;Yihua Liu;Yuli Chen
通讯作者:Yuli Chen
Data Mining Algorithm for Off-Group Points on Noise Polluted Time Series Based on ESO
基于ESO的噪声污染时间序列离群点数据挖掘算法
DOI:--
发表时间:2015
期刊:International Journal of Engineering Innovation & Research
影响因子:--
作者:王福欣;黄志坚;张艳燕;乔梁;李品友
通讯作者:李品友
ADRC Method for Noncascaded Integral System Based on the Total Derivative of Composite Functions of Several Variables
基于多变量复合函数全导数的非级联积分系统ADRC方法
DOI:10.1155/2016/3796486
发表时间:2016-12
期刊:MATHEMATICAL PROBLEMS IN ENGINEERING
影响因子:--
作者:Huang Zhijian;Xiong Xuemei;Wang Hailong;Chen Yuli;Liu Yihua
通讯作者:Liu Yihua
基于深度时间差分Actor-Critic 策略的航行体时空复合大数据学习及避障控制
- 批准号:21ZR1426600
- 项目类别:省市级项目
- 资助金额:0.0万元
- 批准年份:2021
- 负责人:黄志坚
- 依托单位:
国内基金
海外基金















{{item.name}}会员


