基于子图近似匹配的海量知识图谱分布式查询技术研究

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    61702096
  • 项目类别:
    青年科学基金项目
  • 资助金额:
    25.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    F0207.计算机网络
  • 结题年份:
    2020
  • 批准年份:
    2017
  • 项目状态:
    已结题
  • 起止时间:
    2018-01-01 至2020-12-31

项目摘要

Knowledge graphs, which are massive networks containing real-world entities and the entities’ relationships, are commonly used by the next-generation search engines. The knowledge graphs are massive, incomplete and noisy in nature, so it is quite challenging to effectively and efficiently answer knowledge graph queries. The existing researches mainly focused on the query techniques based on subgraph isomorphism models, which are not readily applied to the massive knowledge graphs. This project studies query models, distributed query algorithms and query platforms for knowledge graph queries. Specifically, it designs effective and efficient query processing techniques for the noisy and massive knowledge graphs. We first propose a query model for knowledge graphs by finding the subgraphs that are most similar to a given query graph; we then design a distributed indexing technique for billion-node knowledge graphs to accelerate query processing; at last, we propose the optimization techniques that are based on a shared-memory technique and a novel graph-computation workflow model, which reduce the querying time in a distributed environment. These proposed techniques would be able to enable the next-generation search engines to support the knowledge graphs queries.
知识图谱是描述现实世界中地点、人物等事物以及事物间联系的关系网络,为下一代搜索引擎提供重要数据支撑。知识图谱具有数据量庞大、信息不完整且噪声数据多的本质特征,故设计高效的知识图谱查询机制是当前的热点问题。然而,现有的查询技术大多基于单机环境和子图精确匹配模型,存在查询结果不完整、算法可扩展性差和查询时间长等问题。本项目从知识图谱查询模型、分布式查询算法、分布式查询执行优化三个层面对知识图谱查询问题展开研究,旨在提供快速高效的新型分布式查询技术。首先,研究基于子图近似匹配的知识图谱查询模型,以屏蔽不完整信息和噪声数据。其次,研究基于轻量级索引的分布式查询算法,达到快速响应查询请求的目的。最后,研究面向复杂查询的分布式图计算执行优化机制,进一步优化分布式知识图谱查询的运行时间。本项目成果将为下一代搜索引擎提供行之有效的解决方案,更可推广到于商业分析、生物信息等诸多领域,具有较高的应用价值。

结项摘要

本项目针对亿级顶点知识图谱的分布式查询优化问题展开研究。首先,研究了亿级节点知识图谱的查询问题,提出子图近似匹配模型,能够在超过10亿顶点的知识图谱上进行大于5个节点的近似查询;其次,在查询模型通用求解框架基础上,从轻量级索引的角度对查询任务进行加速,研究分析了轻量级图索引构建方法和基于索引的查询算法,使知识图谱的查询响应时间控制在10秒内;最后,研究面向复杂查询的分布式图计算执行优化技术,综合考虑数据分布、数据加载速度、系统部署效率和复杂查询执行效率等因素,对分布式查询系统的查询任务进行优化,提出分布式图计算工作流模型,设计了面复杂查询的分布式图计算执行优化策略,分布式系统加速比大于1.5,查询初始化时间小于5秒。基于上述理论研究成果,项目组开发实现了面向知识图谱查询的分布式图计算系统。本研究成果能为大规模知识图谱分布式查询提供一定的理论支持和技术借鉴,同时对 于分布式图计算、分布式大数据处理领域的研究提供有益借鉴,同时对于智慧城市、智慧医疗等领域的语义查询具有积极的参考意义。

项目成果

期刊论文数量(13)
专著数量(0)
科研奖励数量(0)
会议论文数量(7)
专利数量(3)
A data-locality-aware task scheduler for distributed social graph queries
用于分布式社交图查询的数据局部性感知任务调度程序
  • DOI:
    10.1016/j.future.2018.04.086
  • 发表时间:
    2019
  • 期刊:
    Future Generation Computer Systems-The International Journal of eScience
  • 影响因子:
    7.5
  • 作者:
    Jin Jiahui;Luo Junzhou;Du Mingyang;Dang Yongcheng;Li Feng;Zhang Jinghui;Song Aibo
  • 通讯作者:
    Song Aibo
Accelerating Skycube Computation with Partial and Parallel Processing for Service Selection
通过服务选择的部分和并行处理加速 Skycube 计算
  • DOI:
    10.1109/tsc.2017.2762681
  • 发表时间:
    2020-11
  • 期刊:
    IEEE Trans. Serv. Comput.
  • 影响因子:
    --
  • 作者:
    Fang Dong;Junzhou Luo;Jiahui Jin;Jiyuan Shi;Ye Yang;Jun Shen
  • 通讯作者:
    Jun Shen
Cooperative storage by exploiting graph-based data placement algorithm for edge computing environment
利用基于图的数据放置算法进行边缘计算环境的协作存储
  • DOI:
    10.1002/cpe.4914
  • 发表时间:
    2018
  • 期刊:
    Concurrency and Computation-Practice & Experience
  • 影响因子:
    2
  • 作者:
    Jin Jiahui;Li Yunhao;Luo Junzhou
  • 通讯作者:
    Luo Junzhou
Facilitating Application-Aware Bandwidth Allocation in the Cloud with One-Step-Ahead Traffic Information
利用一步领先的流量信息促进云中应用程序感知的带宽分配
  • DOI:
    10.1109/tsc.2019.2922176
  • 发表时间:
    2020-03
  • 期刊:
    IEEE Transactions on Services Computing
  • 影响因子:
    8.1
  • 作者:
    Dian Shen;Junzhou Luo;Fang Dong;Jiahui Jin;Junxue Zhang;Jun Shen
  • 通讯作者:
    Jun Shen
VirtCo: joint coflow scheduling and virtual machine placement in cloud data centers
VirtCO:云数据中心中的联合 Coflow 调度和虚拟机放置
  • DOI:
    10.26599/tst.2018.9010098
  • 发表时间:
    2019-10
  • 期刊:
    Tsinghua Science and Technology
  • 影响因子:
    6.6
  • 作者:
    Shen Dian;Luo Junzhou;Dong Fang;Zhang Junxue
  • 通讯作者:
    Zhang Junxue

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

云计算环境下QoS偏好感知的副本选择策略
  • DOI:
    --
  • 发表时间:
    2011
  • 期刊:
    通信学报
  • 影响因子:
    --
  • 作者:
    熊润群;罗军舟;宋爱波;金嘉晖
  • 通讯作者:
    金嘉晖
基于数据中心负载分析的自适应延迟调度算法
  • DOI:
    --
  • 发表时间:
    2011
  • 期刊:
    通信学报
  • 影响因子:
    --
  • 作者:
    金嘉晖;罗军舟;宋爱波;东方
  • 通讯作者:
    东方
云计算:体系架构与关键技术
  • DOI:
    --
  • 发表时间:
    2011
  • 期刊:
    通信学报
  • 影响因子:
    --
  • 作者:
    罗军舟;金嘉晖;宋爱波;东方
  • 通讯作者:
    东方

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

金嘉晖的其他基金

城市知识图谱驱动的群智感知迭代演进机制及其应用研究
  • 批准号:
  • 批准年份:
    2020
  • 资助金额:
    57 万元
  • 项目类别:
    面上项目

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码