关联数据上基于图的分布式查询处理技术研究
结题报告
批准号:
61702171
项目类别:
青年科学基金项目
资助金额:
20.0 万元
负责人:
彭鹏
依托单位:
学科分类:
F0202.系统软件、数据库与工业软件
结题年份:
2020
批准年份:
2017
项目状态:
已结题
项目参与者:
李军义、周四望、李文杰、欧露、徐洋、胡玉涵、刘路
国基评审专家1V1指导 中标率高出同行96.8%
结合最新热点,提供专业选题建议
深度指导申报书撰写,确保创新可行
指导项目中标800+,快速提高中标率
客服二维码
微信扫码咨询
中文摘要
随着关联数据(Linked Data)理念被广泛接受,大量数据被接入关联数据。这其中既包括如DBPedia的能完全下载与管理的RDF数据,也包括如FOAF的难以完全下载与管理的RDF数据,还有如IMDB的接入关联数据的关系数据。关联数据上如此复杂的分布式数据环境为高效的查询处理提出了挑战。为此,本项目以图理论为基础,研究关联数据上分布式查询处理技术。本项目首先将研究利用最新云计算框架SPARK对能完全下载与管理的RDF数据进行查询处理,拟研究的技术将基于查询的图结构来进行查询分解与优化以降低SPARK运算的迭代次数。本项目还将研究利用图探索技术来查询难以完全下载与管理的RDF数据,此研究能利用图结构信息来避免重复计算。最后,对接入关联数据的关系数据,本项目将研究基于图结构的查询重写与优化策略以减少中间结果。本项目的研究将为关联数据上查询处理提供理论方法和技术,对推动关联数据发展有重要意义。
英文摘要
As the principles of Linked Data have been widely accepted, there are an increasing number of datasets linked into Linked Data. The datasets linked into Linked Data include the RDF datasets like DBPedia which can be fully downloaded and managed, the RDF datasets like FOAF which cannot be fully downloaded and managed and the relational datasets like IMDB. The complex distributed data environment over Linked Data poses a great challenge for efficiently query processing. Therefore, we study graph-based distributed query processing over Linked Data. First, we study SPARK-based query processing over RDF datasets which can be fully downloaded and managed, and the graph-based query decomposition and optimization techniques that we plan to study can reduce the number of iterations during the query processing in SPARK. We also study graph exploration-based query processing over RDF datasets which cannot be fully downloaded and managed, and we will utilize the structural information to avoid redundant computation. Last, for the relational datasets in Linked Data, we study graph-based query rewriting and optimization to reduce the number of intermediate results. Our research can propose theories and techniques for query processing over Linked Data, and significantly promote the development of Linked Data.
随着关联数据(Linked Data)理念被广泛接受,大量数据被接入关联数据。这其中既包括能完全下载与管理的RDF数据,也包括难以完全下载与管理的RDF数据,还有整合了关系数据的RDF数据。关联数据上如此复杂的分布式数据环境为高效的查询处理提出了挑战。为此,本项目以图理论为基础,研究关联数据上分布式查询处理技术。本项目首先对能完全下载与管理的RDF数据研究了基于查询日志进行数据划分的分布式RDF数据管理技术。针对难以完全下载与管理的RDF数据,本研究提出了基于局部计算的分布式RDF数据管理技术。最后,对整合了关系数据的RDF数据,本项目研究了联邦型分布式RDF数据库上的查询与检索技术。本项目的研究将为关联数据上查询处理提供理论方法和技术,对推动关联数据发展有重要意义。
期刊论文列表
专著列表
科研奖励列表
会议论文列表
专利列表
Adaptive Distributed RDF Graph Fragmentation and Allocation based on Query Workload
基于查询负载的自适应分布式RDF图分片与分配
DOI:10.1109/tkde.2018.2841389
发表时间:2019-04
期刊:IEEE Transactions on Knowledge and Data Engineering
影响因子:8.9
作者:Peng Peng;Zou Lei;Chen Lei;Zhao Dongyan
通讯作者:Zhao Dongyan
Optimizing Distance Computation in Distributed Graph Systems
优化分布式图系统中的距离计算
DOI:10.1109/access.2020.3032727
发表时间:2020
期刊:IEEE Access
影响因子:3.9
作者:Wang Qing;Ji Shengyi;Peng Peng;Li Mingdao;Huang Ping;Qin Zheng
通讯作者:Qin Zheng
大规模属性图的分布式存储与图模式查询处理方法研究
  • 批准号:
    2025JJ50352
  • 项目类别:
    省市级项目
  • 资助金额:
    0.0万元
  • 批准年份:
    2025
  • 负责人:
    彭鹏
  • 依托单位:
分布式知识图谱结构化查询处理的性能优化技术研究
  • 批准号:
    2022JJ30165
  • 项目类别:
    省市级项目
  • 资助金额:
    0.0万元
  • 批准年份:
    2022
  • 负责人:
    彭鹏
  • 依托单位:
分布式图数据管理系统上的语义数据管理问题研究
  • 批准号:
    2018JJ3065
  • 项目类别:
    省市级项目
  • 资助金额:
    0.0万元
  • 批准年份:
    2018
  • 负责人:
    彭鹏
  • 依托单位:
国内基金
海外基金