可扩展的高效XML数据管理关键技术研究
结题报告
批准号:
61170011
项目类别:
面上项目
资助金额:
56.0 万元
负责人:
陆嘉恒
依托单位:
学科分类:
F0202.系统软件、数据库与工业软件
结题年份:
2015
批准年份:
2011
项目状态:
已结题
项目参与者:
孙辉、柴云鹏、荣垂田、刘真、卢卫、吕瑛、马中瑞、廖承炫、田宗起
国基评审专家1V1指导 中标率高出同行96.8%
结合最新热点,提供专业选题建议
深度指导申报书撰写,确保创新可行
指导项目中标800+,快速提高中标率
客服二维码
微信扫码咨询
中文摘要
随着XML数据在各行各业的广泛应用,XML数据规模不断增大,由此带来的针对分布式海量XML数据管理问题,成为学术界和企业界一个亟待解决的重要课题。本项目研究可扩展的高效XML数据的存储,索引,查询和更新机制。首先,我们拟研究针对XML的key-value存储方案;其次,我们考察基于map-reduce编程框架的分布式XPath和XQuery查询处理和优化技术;然后我们拟研究分布式的基于B树结构的XML索引和更新机制,最后我们将建立一个海量分布式XML数据的存储和查询的原型系统。针对目前海量半结构化数据管理的挑战,本研究不但具有学术价值,而且还具有广泛的应用前景。
英文摘要
可扩展标记语言(eXtensible Markup Language,XML)是Internet上一种新的数据表示、存储和交换标准。XML推荐标准1.0版发布于1998年2月,之后迅速在全球掀起了XML应用的浪潮。 随着XML数据在各行各业的广泛应用,XML数据的规模不断增大,由此带来的针对海量XML数据的存储和高效查询等机制的研究成为学术界和企业界一个亟待解决的重要课题。为了满足针对海量XML数据高效处理的需求,可扩展的XML数据管理技术就成为了我们研究的方向。本课题组的全体成员通过四年的努力,在分布式海量XML数据管理技术方面有所新的发现和突破,基于该课题发表了一批国际一流的学术论文,推动了该领域的研究和发展。 ..具体的来说,本课题(1)研究了XML的存储和关键词查询技术,提出了针对海量数据的高效查询改写的算法,成果发表在SIGMOD, ACM TODS等顶级期刊会议上;(2)研究了多种XML查询的算法,包括分布式XPath和XQuery查询处理, 扩展树结构,通配符结构等,大大提高了XML数据查询处理的能力;成果发表在VLDB Journal等期刊中;(3)研究了海量异构数据的索引更新和Hadoop Mapreduce 的性能优化技术,提出了一套新的体系结构,研究成果发表在VLDB 2014等国际会议中,获得广泛关注。.. 本课题在国际交流合作、论文发表、人才培养及专利申请方面均取得一定成果,包括:1)在国内外一流会议期刊发表论文16篇,其中国际数据库顶级会议SIGMOD 发表研究长文两篇,VLDB 一篇,国际数据库顶级期刊VLDB Journal 一篇,和 ACM Trandaction on data management 两篇等;2)申请发明专利3项,软件著作权7项,出版关于XML的全英文专著一本;3)培养硕士研究生12名,博士研究生3名;4)研究内容作为本科生和研究生教材,相关课程获教育部IBM精品课程称号,相关教材获得北京市精品教材的称号;5)与新加坡国立、南洋理工、法国电信研究院、南丹麦科技大学等建立学术交流互访活动;6)课题组组长担任ICDE,SIGMOD等国际顶级会议的Proceeding chair, workshop chair, PC member 等学术兼职。
期刊论文列表
专著列表
科研奖励列表
会议论文列表
专利列表
DOI:10.14778/2733004.2733005
发表时间:2014-08
期刊:Proc. VLDB Endow.
影响因子:--
作者:Juwei Shi;Jia Zou;Jiaheng Lu;Zhao Cao;Shiqiang Li;Chen Wang
通讯作者:Juwei Shi;Jia Zou;Jiaheng Lu;Zhao Cao;Shiqiang Li;Chen Wang
DOI:10.14778/2831360.2831366
发表时间:2015-09
期刊:Proc. VLDB Endow.
影响因子:--
作者:Yu Liu;Jiaheng Lu;Hua Yang;Xiaokui Xiao;Zhewei Wei
通讯作者:Yu Liu;Jiaheng Lu;Hua Yang;Xiaokui Xiao;Zhewei Wei
Proceedings of the Third International Workshop on Keyword Search on Structured Data
第三届结构化数据关键词搜索国际研讨会论文集
DOI:--
发表时间:2012
期刊:Conference SIGMOD/PODS '12 International Conference on Management of Data
影响因子:--
作者:Ling Tok Wang;Yu Ge;Lu Jiaheng;Wang Wei
通讯作者:Wang Wei
Big data challenge: a data management perspective
大数据挑战:数据管理视角
DOI:10.1007/s11704-013-3903-7
发表时间:2013-04-01
期刊:FRONTIERS OF COMPUTER SCIENCE
影响因子:4.2
作者:Chen, Jinchuan;Chen, Yueguo;Zhou, Xuan
通讯作者:Zhou, Xuan
Optimal and efficient generalized twig pattern processing: a combination of preorder and postorder filterings
最优且高效的广义树枝图案处理:前序和后序过滤的组合
DOI:10.1007/s00778-012-0295-5
发表时间:2012-10
期刊:VLDB Journal
影响因子:4.2
作者:Baca Radim;Kratky Michal;Ling Tok Wang;Lu Jiaheng
通讯作者:Lu Jiaheng
基于频繁更新的大图数据查询和管理技术研究
  • 批准号:
    61472427
  • 项目类别:
    面上项目
  • 资助金额:
    80.0万元
  • 批准年份:
    2014
  • 负责人:
    陆嘉恒
  • 依托单位:
移动环境中关键词搜索的关键技术研究
  • 批准号:
    60903056
  • 项目类别:
    青年科学基金项目
  • 资助金额:
    19.0万元
  • 批准年份:
    2009
  • 负责人:
    陆嘉恒
  • 依托单位:
国内基金
海外基金