不确定XML数据查询处理关键技术研究

批准号:
61202083
项目类别:
青年科学基金项目
资助金额:
23.0 万元
负责人:
宁博
依托单位:
学科分类:
F0202.系统软件、数据库与工业软件
结题年份:
2015
批准年份:
2012
项目状态:
已结题
项目参与者:
林国顺、刘宁、肖智博、牛盼盼、李新龙、张广、闫振丰
国基评审专家1V1指导 中标率高出同行96.8%
结合最新热点,提供专业选题建议
深度指导申报书撰写,确保创新可行
指导项目中标800+,快速提高中标率
微信扫码咨询
中文摘要
随着传感器网络、RFID等感知技术的应用推广,越来越多的不确定性数据需要被管理和应用,而半结构化数据XML能够很好的对不确定性数据进行表达,因此不确定XML数据库成为数据库领域的热点研究问题。查询处理技术是不确定XML数据管理的核心。不确定XML数据库在传统半结构化数据库的基础上引入了概率来表达不确定性,传统技术不能很好的解决概率带来的新问题,大量的概率信息为数据存储、索引建立和查询处理提出了新的问题和挑战。在新的应用不断发展的背景下,不确定XML数据的复杂查询处理有待进一步深入研究。本项目将研究概率XML数据查询处理的关键技术,提出适应于新应用的通用不确定XML数据模型,设计概率XML文档的编码和存储策略,针对几种复杂查询类型,设计实现查询算法,并构建索引提高查询效率。本项目能解决不确定XML数据的查询处理问题,进一步拓宽不确定数据的实际应用,具有重要的理论意义与实际应用价值。
英文摘要
With the wild application of sensor network and RFID, more and more uncertain data need to be managed and applied. The XML which is a kind of semi-structured data naturally express the uncertainty of uncertain data, therefore uncertain XML database has become the hot topic in database research area. The query processing is the core part of uncertain XML data management. Uncertain XML database is based on the traditional XML database technology, while the addition information is the probabilistic values. The new problem brought by probabilistic values can not be solved by traditional techniques, including storage, index and query processing. Therefore it is a new challenge. With the development of new applications, the researches on uncertain XML data need to be done eagerly. In this project, we study the key techniques of query processing on probabilistic XML data, and we propose new data model for general cases, and design the encoding and storage schemes. To solve the complicated query types, we design the query algorithms and build the index to increase the efficiency. We believe that our project can solve the problems of query processing in uncertain XML database. Also we can apply more uncertain data in the practical applications. The project has values of both theory and practical applications.
本项目的执行时间是2013.1——2015.12,这期间项目主要研究了概率XML查询处理技术的各个方面,现总结如下:.1. 在概率XML数据模型和文档编码方面,项目组提出了基于前缀的PEDewey编码策略,既考虑了文档结构又考虑了文档中的概率。.2. 在概率XML数据查询处理方面,项目组提出了概率XML文档上的twig查询处理;在概率XML文档上的Top-k查询处理方面,提出了两种解决方案,分别是基于概率约束优先策略的Top-k概率查询处理和基于混合策略的Top-k概率查询处理方法。.3. 在概率XML数据上的布尔型查询方面,项目组提出了支持反向轴的XPath表达式文档过滤方法,该方法中提出了PXPE-树索引结构、支持反向轴表达式的过滤算法;项目组提出了基于阈值查询的概率XML文档过滤算法,该方法中提出了PXTrie查询分解、PXTrie索引、以及支持阈值查询的概率XML文档过滤算法。.4. 在概率XML文档的关键字检索方面,项目组提出了Top-k关键字检索算法,其中研究了概率XML数据分片技术,概率XML数据的索引技术和基于概率XML分区SLCA概率计算算法。.5. 本项目实施过程中,.项目组已在Information Sciences、World Wide Web Journal、NDBC、FSKD、清华大学学报等国际国内期刊和会议上发表(含已录用)论文7 篇,其中三篇SCI,4篇EI检索。培养毕业研究生2名。本项目已经严格按照计划要点进行执行,并达到预期的研究成果。
期刊论文列表
专著列表
科研奖励列表
会议论文列表
专利列表
DOI:10.1016/j.ins.2015.12.034
发表时间:2016-04
期刊:Inf. Sci.
影响因子:--
作者:Ye Yuan;Guoren Wang;Lei Chen;B. Ning
通讯作者:Ye Yuan;Guoren Wang;Lei Chen;B. Ning
XML filtering with XPath expressions containing parent and ancestor axes
使用包含父轴和祖先轴的 XPath 表达式进行 XML 过滤
DOI:10.1016/j.ins.2012.04.035
发表时间:2012-11
期刊:Information Sciences
影响因子:8.1
作者:Ning, Bo;Liu, Chengfei
通讯作者:Liu, Chengfei
DOI:--
发表时间:--
期刊:清华大学学报(自然科学版)
影响因子:--
作者:宁博;裴晓霞;李玉居;裴新宇
通讯作者:裴新宇
DOI:10.1007/s11280-011-0144-2
发表时间:2013-05
期刊:World Wide Web
影响因子:--
作者:B. Ning;Chengfei Liu;J. Yu
通讯作者:B. Ning;Chengfei Liu;J. Yu
国内基金
海外基金
