基于虚拟个体行为逼近的多机器人自学习决策与协调控制一体化

批准号:
61873248
项目类别:
面上项目
资助金额:
63.0 万元
负责人:
陈鑫
依托单位:
学科分类:
F0309.机器人学与智能系统
结题年份:
2022
批准年份:
2018
项目状态:
已结题
项目参与者:
徐迟、丁敏、王巍、符浩、王婕、李璐、张浩阳
国基评审专家1V1指导 中标率高出同行96.8%
结合最新热点,提供专业选题建议
深度指导申报书撰写,确保创新可行
指导项目中标800+,快速提高中标率
微信扫码咨询
中文摘要
针对柔性任务具有的未知环境、变负载和未知扰动等复杂情况,本项目主要解决多机器人动态决策与多个体协调控制相融合的问题。研究构建多个体的分层分布式决策—控制架构,建立规范个体行为的虚拟个体,并基于其实现迭代合作策略学习和有限连续时间一致性控制的融合。对执行柔性任务时多机器人协同决策需求,研究结合知识迁移的连续空间分布式策略学习方法,保证在未知环境下多机器人高效自学习决策;考虑机器人变负载导致动态特征未知及未知扰动情况,研究基于鲁棒自适应动态规划的模型参考自适应控制方法,实现未知动态个体对理想参考行为模型的自适应逼近;以参考行为模型为虚拟个体的动态模型,设计有限时间一致性协议,实现与迭代策略学习的结合。最后,建立多机械臂仿真实验平台,验证自学习决策与协调控制一体化方法的有效性与工程适用性。本项目将为智能制造领域面向柔性任务的多机器人系统提供新的智能决策和控制设计方案,具有重要理论意义和应用前景。
英文摘要
To tackle the complex conditions in flexible task, such as uncertain environment, variable load, and unpredictable disturbance, the project mainly investigates the integration of dynamic decision-making and coordination control among multiple robots. A multi-layer distributed decision-making–control architecture for multiple agents will be developed, in which a virtual agent is designed to regulate individual behavior, so that based on it, the iterative cooperative strategy learning and the finite-time consensus control work together smoothly. To meet the requirements of cooperative decision when a flexible task is being executed, a knowledge transfer-based continuous space distributed learning will be studied to ensure efficient self-learning decision-making of multi-robot under an unknown environment. With the conditions of unknown dynamics characteristics resulting from variable load, and unpredictable disturbance taken into account, a robust adaptive dynamic programming-based model reference adaptive control method will be studied, which makes an individual robot enable to approximate a predetermined reference behavior model adaptively, even whose dynamic model is unknown in priori. Then this reference behavior model serves as a dynamic model of a virtual agent, based on which a finite-time consensus protocol will be designed. Finally, a simulation system and a multiple manipulators experimental system will be constructed, in order to test the integration of self-learning decision-making and coordinate control, from the aspects of effectiveness and engineering applicability. The project has important theoretical significance and application prospect for providing a new solution to design intelligent decision-making and control system for multi-robot systems, which are applied for the flexible tasks of intelligent manufacturing.
本项目为实现多机器人在变负载和未知扰动环境下的策略实时优化与协调控制,构建了一种结合合作策略优化与一致性控制的优化模型,以虚拟个体的参考行为模型为桥梁,形成由合作策略学习、一致性控制、MRAC构成的分层决策-控制架构。首先,针对连续空间中多机器人系统的合作策略学习问题,提出基于连续空间合作策略搜索的分布式同时学习方法;同时,研究基于高斯核函数的双阶段值迭代算法,解决连续空间合作策略学习的泛化问题;针对多机器人系统从头学习效率低的问题,将一种知识迁移机制用于多机器人系统的智能决策和自学习控制中。其次,为实现个体动态未知和随机环境下异构多智能体系统的一致性控制,构造确定性参考行为模型,提出基于自适应动态规划的模型参考自适应控制方法,实现智能体行为对参考行为模型的逼近;针对鲁棒控制对精确数学模型依赖性的问题,提出了一种鲁棒ADP方法,实现了在变负载、未知扰动条件下的高品质高精度MRAC。此外,考虑到离散时间分布式策略学习与多机器人期望内模式跟踪控制的配合,需要实现有限时间内一致性控制才能保证合作策略学习的有效进行,首先针对具有随机扰动的未知环境下的线性系统的最优跟踪控制问题,研究了基于值迭代的最优跟踪控制方法;然后针对异构非线性多智能体系统,提出了基于参考模型的分布式一致性控制方法。通过搭建针对多机器人系统的仿真系统及实际系统实验平台,验证了所提方法的可行性和高效性。本项目的研究为复杂未知环境下的多机器人系统提供了一种切实可行的合作策略优化与一致性控制方法,有力促进了协作式多机器人系统在复杂任务与未知环境下的应用,具有重要的理论意义和工程应用价值。
期刊论文列表
专著列表
科研奖励列表
会议论文列表
专利列表
Model-free output consensus control for partially observable heterogeneous multivehicle systems
部分可观测异构多车辆系统的无模型输出一致性控制
DOI:10.1109/jiot.2020.2981654
发表时间:2020
期刊:IEEE Internet of Things Journal
影响因子:10.6
作者:Yipu Sun(博士生);Xin Chen;Wei Wang;Hao Fu;Min Wu
通讯作者:Min Wu
Data-driven adaptive dynamic programming for partially observable nonzero sum games via Q-learning method
通过 Q 学习方法实现部分可观察非零和博弈的数据驱动自适应动态规划
DOI:10.1080/00207721.2019.1599463
发表时间:2019
期刊:International Journal of Systems Science
影响因子:4.3
作者:Wei Wang(博士生);Xin Chen;Hao Fu;Min Wu
通讯作者:Min Wu
DOI:doi.org/10.1016/j.amc.2022.127504.
发表时间:2022
期刊:Applied Mathematics and Computation
影响因子:--
作者:Jie Wang(博士生);Xin Chen
通讯作者:Xin Chen
H∞ consensus for stochastic Markov jump multi-agent systems with imperfect time-varying transition probabilities and multiplicative noise
具有不完美时变转移概率和乘性噪声的随机马尔可夫跳跃多智能体系统的 H 共识
DOI:10.1016/j.amc.2022.127504
发表时间:2023-01
期刊:Applied Mathematics and Computation
影响因子:4
作者:Jie Wang(博士生);Xin Chen
通讯作者:Xin Chen
Neural-network-based stochastic linear quadratic optimal tracking control scheme for unknown discrete-time systems using adaptive dynamic programming
基于神经网络的自适应动态规划未知离散时间系统随机线性二次最优跟踪控制方案
DOI:10.1007/s11768-021-00046-y
发表时间:2021-06
期刊:Control Theory and Technology
影响因子:1.4
作者:Xin Chen;Fang Wang
通讯作者:Fang Wang
西藏冈底斯西段北姆朗斑岩铜矿床中硼的富集机制及其对铜成矿作用的制约
- 批准号:42372092
- 项目类别:面上项目
- 资助金额:53万元
- 批准年份:2023
- 负责人:陈鑫
- 依托单位:
深俯冲陆壳折返过程中高场强元素在熔/流体中的活动性探究–以柴北缘超高压带鱼卡和绿梁山地区为例
- 批准号:42102058
- 项目类别:青年科学基金项目
- 资助金额:30万元
- 批准年份:2021
- 负责人:陈鑫
- 依托单位:
基于双时间尺度优化的多机器人策略自适应与一致性
- 批准号:61473316
- 项目类别:面上项目
- 资助金额:82.0万元
- 批准年份:2014
- 负责人:陈鑫
- 依托单位:
国内基金
海外基金
