智能规划中派生谓词规则和不确定动作模型的自动获取

批准号:
61003179
项目类别:
青年科学基金项目
资助金额:
20.0 万元
负责人:
饶东宁
依托单位:
学科分类:
F0607.知识表示与处理
结题年份:
2013
批准年份:
2010
项目状态:
已结题
项目参与者:
蒋志华、王丽娟、曾安、林伟、张灵、叶雄杰、濮辉
国基评审专家1V1指导 中标率高出同行96.8%
结合最新热点,提供专业选题建议
深度指导申报书撰写,确保创新可行
指导项目中标800+,快速提高中标率
微信扫码咨询
中文摘要
本研究拟通过学习结构化定义提高规划领域知识的自动获取能力,增强规划技术的可用性.动作模型和派生谓词规则均为规划领域描述中的结构化定义,手工编写这些定义费时又易错. 已有研究多从规划例中学习确定性动作模型,本课题拟从规划例中学习不确定性动作和派生谓词规则.具体研究内容包括:用基于归纳的方法学习一阶派生谓词规则,并将该方法扩展到不确定规划和部分观测环境中;结合约束满足学习不确定动作模型,并将该方法扩展到部分观测环境;将上述方法用于WSC问题产生WS的不确定动作模型,验证动作模型学习且可增强规划在WSC领域的可用性.其中重点和难点是一阶派生谓词规则的学习以及利用结构相似性提出不确定动作模型的学习.这是首次提出派生谓词规则的学习方法,首次学习不确定动作模型并扩展到部分观测环境.本课题可丰富规划领域知识自动获取技术,验证动作模型学习进而增强规划技术的可用性.
英文摘要
本项目通过学习不确定动作模型和派生谓词规则来提高规划领域知识的自动获取能力。动作模型和派生谓词规则均为规划领域描述的主体内容,虽用途不同但具有相似的结构化定义。但是手工编写这些定义既费时又易出错。已有不少研究从规划例中学习确定性动作模型或提取公理规则,但鲜有研究提取不确定动作模型(比确定性动作模型更一般)或者派生谓词规则(特殊的公理规则),更少见的是在部分观测的环境下提取二者。本项目先提出在完全观测环境下自动获取派生谓词规则和不确定动作模型的方法,然后将其扩展到部分观测的环境中。.所有原定研究目标均以实现。具体研究成果分类列举如下。(1)实现派生谓词规则的自动获取。分为两个情况。a)学习过程在基本的完全观测环境下进行,状态信息是完备的。提出产生训练例的基本规则,并利用谓词依赖关系增加规则候选式以改进一阶规则学习方法,从而实现派生谓词规则的自动获取。b)学习过程在一般的部分观测环境下进行,状态信息是不完备的,特别是动作的非直接效果(用派生谓词描述)是未知的。引入观测来产生待学习谓词的训练例,并基于实验探讨学习精准率与环境观测率之间的关系。(2)实现不确定动作模型的自动获取。同样分为两个情况。a)在基本的完全观测环境下,通过谓词变化集合来产生动作模型中前提和效果的候选式,对样例的不同解释程度产生不同的效果集合从而形成不确定的动作模型。b)上述方法扩展到一般的部分观测环境,使用观测来构成部分状态信息。计算命题在信念状态中成立的概率,根据概率变化来抽取效果模式和前提模式,并对效果模式进行聚类以去除冗余。(3)扩展派生谓词规则的应用。包括两点内容。a)使用派生谓词规则显式描述目标子集的存在条件,使用偏好表示目标子集的效益,从而扩展规划系统处理目标效益依赖的能力。b)使用派生谓词规则表示衍生目标与动作效果之间的依赖关系,借助角色来识别规划解的循环结构,从而实现在派生谓词规划领域提取通用规划解。(4)用数据库直接进行规划求解。对规划领域各组成要素建立实体关系模型,并使用存储过程来进行规划求解。
期刊论文列表
专著列表
科研奖励列表
会议论文列表
专利列表
DOI:--
发表时间:2011
期刊:计算机学报
影响因子:--
作者:蒋志华;饶东宁;姜云飞;江洪
通讯作者:江洪
DOI:--
发表时间:2013
期刊:软件学报
影响因子:--
作者:饶东宁;蒋志华;姜云飞
通讯作者:姜云飞
DOI:--
发表时间:2011
期刊:软件学报
影响因子:--
作者:蒋志华;饶东宁;姜云飞;朱慧泉
通讯作者:朱慧泉
DOI:--
发表时间:2014
期刊:软件学报
影响因子:--
作者:饶东宁;蒋志华;姜云飞
通讯作者:姜云飞
DOI:--
发表时间:2011
期刊:计算机应用研究
影响因子:--
作者:饶东宁;蒋志华;姜云飞
通讯作者:姜云飞
国内基金
海外基金
