大规模OWL本体的分布式调试方法研究

批准号:
61370154
项目类别:
面上项目
资助金额:
75.0 万元
负责人:
吴刚
依托单位:
学科分类:
F0607.知识表示与处理
结题年份:
2017
批准年份:
2013
项目状态:
已结题
项目参与者:
夏利、程经纬、刘君、陈忱、丁琳琳、刘洪伟、吴利娟、王永选、张舒
国基评审专家1V1指导 中标率高出同行96.8%
结合最新热点,提供专业选题建议
深度指导申报书撰写,确保创新可行
指导项目中标800+,快速提高中标率
微信扫码咨询
中文摘要
语义Web的发展促使大量OWL本体在Web上发布并互连成链接数据。这种开放链接方式下,本体自身演化或本体间链接更新都可能导致逻辑冲突。通常可采用本体调试技术,通过找出一组最小冲突公理集合作为调试信息的方法来帮助定位并解释冲突原因。目前尚无证据表明已有的本体调试技术及优化方法能有效处理含十亿数量级三元组的OWL本体。当前急需新的OWL本体调试技术来解决在Web 规模本体上进行有效逻辑冲突调试及推理结果解释等问题。课题拟采用分布式处理技术突破I/O和主存对大规模OWL本体存储和处理能力的限制,研究大规模OWL本体的高效调试和解释方法,内容涉及分布式环境下支持OWL本体调试的存储结构设计;求取本体调试信息(最小冲突公理集合)的分布式算法及优化技术;存储更新和增量式求取算法;面向用户的调试信息度量和Top-k算法;近似调试算法。拟将成果用于构建一个提供大规模OWL本体在线调试和解释服务的原型系统。
英文摘要
With the recent development of the semantic Web, a large number of OWL ontologies have been published and linked on the Web as a so-called Linking Open Data set. Logical conflicts are inevitable in such open linked ontologies considering the evolution of themselves and the update of links. Usually, the conflicts can be pinpointed and explained utilizing ontology debugging techniques which try to find a set of minimal conflict subsets of axioms as the debugging information. However, existing ontology debugging approaches and optimization techniques have not been proven to have the ability of handling OWL ontologies consisting of more than one billion RDF triples. Obviously, it is necessary to propose novel ontology debugging techniques for OWL to fulfill the requirements of efficient logical conflicts debugging and explaining on billion-scale OWL ontologies. In this research, we will adapt distributed computing technologies to break through the limitation of I/O and main memory on storing and processing large-scale OWL ontologies, based on which we will develop efficient ontology debugging and explanation approaches for large-scale OWL ontologies. The main research contents include: design of the distributed storage structure supporting the ontology debugging for OWL; distributed minimal conflict subsets finding algorithms and optimization techniques; storage updating algorithms and incremental finding algorithms; user oriented debuging information measurements and corresponding Top-k ranking algorithms; and approximate algorithms for distributed OWL debugging. The research results will be applied in a prototype system that provides services of online ontology debugging and explaining for billion-scale real OWL ontologies.
语义Web的发展促使大量OWL本体在Web上发布并互连成链接数据。这种开放链接方式下,本体自身演化或本体间链接更新都可能导致逻辑冲突。通常可采用本体调试技术,通过找出一组最小冲突公理集合作为调试信息的方法来帮助定位并解释冲突原因。目前尚无证据表明已有的本体调试技术及优化方法能有效处理含十亿数量级三元组的OWL本体。当前急需新的OWL本体调试技术来解决在Web 规模本体上进行有效逻辑冲突调试及推理结果解释等问题。课题采用分布式处理技术突破I/O和主存对大规模OWL本体存储和处理能力的限制,研究了一系列大规模OWL本体的高效调试和解释方法。.在分布式环境下支持OWL本体调试的存储结构设计方面,分别提出了将本体和调试信息存储于Hadoop HDFS,以及存储于Cassandra分布式数据库两套方案。此外,针对分布式本体调试的特点,研究了分布式内存数据库集群系统的可用性。.在存储更新和增量式求取算法方面,提出了在本体增加和删除情况下的本体调试信息的更新策略,以支持动态进行本体推理与调试信息更新。设计了相关缓存机制,避免重复求取所推理的蕴含集。.在求取本体调试信息的分布式算法及优化技术方面,分别研究了采用MapReduce计算模型的方法,以及采用基于内存的分布式计算框架Spark,提升实时计算和迭代计算性能的方法。此外,提出先构造与调试目标相关的依赖子图,再基于依赖子图进行调试的优化策略,通过减小搜索空间来加快调试速度。.在面向用户的调试信息度量和Top-k算法方面,提出一套面向用户认知的OWL本体辩解度量指标,综合考虑复杂度、相关度和新颖度三方面,并在此基础上,采用ListNet 排序学习方法构造Top-k辩解排序模型。该方法在辩解排序准确率方面表现良好。.共计发表论文(含录用)15 篇,其中期刊论文9 篇,会议论文6篇,SCI 检索2 篇,EI 检索7 篇;授权国家发明专利4项;人才培养方面,先后培养硕士生16 名;国际交流合作方面,与南京大学、东南大学、清华大学进行了广泛合作交流。.成果理论意义:1)结合数据库领域的相关思想和理论,解决了本体调试信息的有效存储与管理问题;2)利用多种分布式计算模型,提高调试信息求解性能;3)结合信息检索和机器学习领域的研究成果,提高了调试结果排序准确性问题。成果应用价值:构建了一个能够提供大规模OWL本体在线调试和解释服务的原型系统。
期刊论文列表
专著列表
科研奖励列表
会议论文列表
专利列表
DOI:10.1017/s0269888916000059
发表时间:2016-04
期刊:The Knowledge Engineering Review
影响因子:--
作者:Fu Zhang;Jingwei Cheng;Zongmin Ma
通讯作者:Fu Zhang;Jingwei Cheng;Zongmin Ma
DOI:--
发表时间:--
期刊:郑州大学学报(理学版)
影响因子:--
作者:吴刚;闫智宣;邱煜晶;卢海强;李洋
通讯作者:李洋
DOI:--
发表时间:2016
期刊:网络与信息安全学报
影响因子:--
作者:邓诗卓;姚继涛;王波涛;陈月梅;袁野;李艳辉;王国仁
通讯作者:王国仁
DOI:--
发表时间:2014
期刊:华东师范大学学报(自然科学版)
影响因子:--
作者:江泽源;刘辉林;吴刚;王国仁
通讯作者:王国仁
DOI:--
发表时间:2014
期刊:华东师范大学学报(自然科学版)
影响因子:--
作者:李梁;吴刚;刘辉林;王国仁
通讯作者:王国仁
内存数据库容错关键技术研究
- 批准号:61872072
- 项目类别:面上项目
- 资助金额:63.0万元
- 批准年份:2018
- 负责人:吴刚
- 依托单位:
国内基金
海外基金
