基于子图近似匹配的海量知识图谱分布式查询技术研究
项目介绍
AI项目解读
基本信息
- 批准号:61702096
- 项目类别:青年科学基金项目
- 资助金额:25.0万
- 负责人:
- 依托单位:
- 学科分类:F0207.计算机网络
- 结题年份:2020
- 批准年份:2017
- 项目状态:已结题
- 起止时间:2018-01-01 至2020-12-31
- 项目参与者:方效林; 张竞慧; 沈典; 徐祝庆; 张欢欢; 李云昊; 王睿;
- 关键词:
项目摘要
Knowledge graphs, which are massive networks containing real-world entities and the entities’ relationships, are commonly used by the next-generation search engines. The knowledge graphs are massive, incomplete and noisy in nature, so it is quite challenging to effectively and efficiently answer knowledge graph queries. The existing researches mainly focused on the query techniques based on subgraph isomorphism models, which are not readily applied to the massive knowledge graphs. This project studies query models, distributed query algorithms and query platforms for knowledge graph queries. Specifically, it designs effective and efficient query processing techniques for the noisy and massive knowledge graphs. We first propose a query model for knowledge graphs by finding the subgraphs that are most similar to a given query graph; we then design a distributed indexing technique for billion-node knowledge graphs to accelerate query processing; at last, we propose the optimization techniques that are based on a shared-memory technique and a novel graph-computation workflow model, which reduce the querying time in a distributed environment. These proposed techniques would be able to enable the next-generation search engines to support the knowledge graphs queries.
知识图谱是描述现实世界中地点、人物等事物以及事物间联系的关系网络,为下一代搜索引擎提供重要数据支撑。知识图谱具有数据量庞大、信息不完整且噪声数据多的本质特征,故设计高效的知识图谱查询机制是当前的热点问题。然而,现有的查询技术大多基于单机环境和子图精确匹配模型,存在查询结果不完整、算法可扩展性差和查询时间长等问题。本项目从知识图谱查询模型、分布式查询算法、分布式查询执行优化三个层面对知识图谱查询问题展开研究,旨在提供快速高效的新型分布式查询技术。首先,研究基于子图近似匹配的知识图谱查询模型,以屏蔽不完整信息和噪声数据。其次,研究基于轻量级索引的分布式查询算法,达到快速响应查询请求的目的。最后,研究面向复杂查询的分布式图计算执行优化机制,进一步优化分布式知识图谱查询的运行时间。本项目成果将为下一代搜索引擎提供行之有效的解决方案,更可推广到于商业分析、生物信息等诸多领域,具有较高的应用价值。
结项摘要
本项目针对亿级顶点知识图谱的分布式查询优化问题展开研究。首先,研究了亿级节点知识图谱的查询问题,提出子图近似匹配模型,能够在超过10亿顶点的知识图谱上进行大于5个节点的近似查询;其次,在查询模型通用求解框架基础上,从轻量级索引的角度对查询任务进行加速,研究分析了轻量级图索引构建方法和基于索引的查询算法,使知识图谱的查询响应时间控制在10秒内;最后,研究面向复杂查询的分布式图计算执行优化技术,综合考虑数据分布、数据加载速度、系统部署效率和复杂查询执行效率等因素,对分布式查询系统的查询任务进行优化,提出分布式图计算工作流模型,设计了面复杂查询的分布式图计算执行优化策略,分布式系统加速比大于1.5,查询初始化时间小于5秒。基于上述理论研究成果,项目组开发实现了面向知识图谱查询的分布式图计算系统。本研究成果能为大规模知识图谱分布式查询提供一定的理论支持和技术借鉴,同时对 于分布式图计算、分布式大数据处理领域的研究提供有益借鉴,同时对于智慧城市、智慧医疗等领域的语义查询具有积极的参考意义。
项目成果
期刊论文数量(13)
专著数量(0)
科研奖励数量(0)
会议论文数量(7)
专利数量(3)
A data-locality-aware task scheduler for distributed social graph queries
用于分布式社交图查询的数据局部性感知任务调度程序
- DOI:10.1016/j.future.2018.04.086
- 发表时间:2019
- 期刊:Future Generation Computer Systems-The International Journal of eScience
- 影响因子:7.5
- 作者:Jin Jiahui;Luo Junzhou;Du Mingyang;Dang Yongcheng;Li Feng;Zhang Jinghui;Song Aibo
- 通讯作者:Song Aibo
Accelerating Skycube Computation with Partial and Parallel Processing for Service Selection
通过服务选择的部分和并行处理加速 Skycube 计算
- DOI:10.1109/tsc.2017.2762681
- 发表时间:2020-11
- 期刊:IEEE Trans. Serv. Comput.
- 影响因子:--
- 作者:Fang Dong;Junzhou Luo;Jiahui Jin;Jiyuan Shi;Ye Yang;Jun Shen
- 通讯作者:Jun Shen
Cooperative storage by exploiting graph-based data placement algorithm for edge computing environment
利用基于图的数据放置算法进行边缘计算环境的协作存储
- DOI:10.1002/cpe.4914
- 发表时间:2018
- 期刊:Concurrency and Computation-Practice & Experience
- 影响因子:2
- 作者:Jin Jiahui;Li Yunhao;Luo Junzhou
- 通讯作者:Luo Junzhou
Facilitating Application-Aware Bandwidth Allocation in the Cloud with One-Step-Ahead Traffic Information
利用一步领先的流量信息促进云中应用程序感知的带宽分配
- DOI:10.1109/tsc.2019.2922176
- 发表时间:2020-03
- 期刊:IEEE Transactions on Services Computing
- 影响因子:8.1
- 作者:Dian Shen;Junzhou Luo;Fang Dong;Jiahui Jin;Junxue Zhang;Jun Shen
- 通讯作者:Jun Shen
VirtCo: joint coflow scheduling and virtual machine placement in cloud data centers
VirtCO:云数据中心中的联合 Coflow 调度和虚拟机放置
- DOI:10.26599/tst.2018.9010098
- 发表时间:2019-10
- 期刊:Tsinghua Science and Technology
- 影响因子:6.6
- 作者:Shen Dian;Luo Junzhou;Dong Fang;Zhang Junxue
- 通讯作者:Zhang Junxue
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
云计算环境下QoS偏好感知的副本选择策略
- DOI:--
- 发表时间:2011
- 期刊:通信学报
- 影响因子:--
- 作者:熊润群;罗军舟;宋爱波;金嘉晖
- 通讯作者:金嘉晖
基于数据中心负载分析的自适应延迟调度算法
- DOI:--
- 发表时间:2011
- 期刊:通信学报
- 影响因子:--
- 作者:金嘉晖;罗军舟;宋爱波;东方
- 通讯作者:东方
云计算:体系架构与关键技术
- DOI:--
- 发表时间:2011
- 期刊:通信学报
- 影响因子:--
- 作者:罗军舟;金嘉晖;宋爱波;东方
- 通讯作者:东方
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}

内容获取失败,请点击重试

查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图

请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
金嘉晖的其他基金
城市知识图谱驱动的群智感知迭代演进机制及其应用研究
- 批准号:
- 批准年份:2020
- 资助金额:57 万元
- 项目类别:面上项目
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}