RDF Data Management

RDF数据管理

基本信息

  • 批准号:
    RGPIN-2014-03659
  • 负责人:
  • 金额:
    $ 3.93万
  • 依托单位:
  • 依托单位国家:
    加拿大
  • 项目类别:
    Discovery Grants Program - Individual
  • 财政年份:
    2018
  • 资助国家:
    加拿大
  • 起止时间:
    2018-01-01 至 2019-12-31
  • 项目状态:
    已结题

项目摘要

Graph data are of growing importance in many applications including the semantic web, social network analysis, bioinformatics, and physical communication networks. Graphs naturally model complicated structures in these fields, such as the relationships among people in a social network or the protein-protein interaction networks. The size and complexity of these graph data raise significant data management and data analysis challenges. My broad research scope is the study of these problems.**In this discovery grant, my focus is on the graph structures that arise from models of Web resources. The Resource Description Framework (RDF) is the standard (proposed by W3C) by which Web objects are commonly modeled. RDF is a self-descriptive data model that is suitable for machine understanding and interpretation, and, therefore, expected to facilitate the "semantic web". W3C has also defined a query language, called SPARQL, for accessing RDF repositories. RDF data sets have started to proliferate and grow. For example, Yago and DBPedia extract facts from Wikipedia and store them in RDF format to facilitate structural queries over Wikipedia; many local governments are now encoding the resources they provide to citizens in RDF format as part of the e-government initiatives; biologists have built elaborate RDF data collections (BioRDF and Uniprot RDF) for community sharing of experimental data; and Linked Open Data (LOD) initiative has been growing (as of September 2011 - which are the latest available information - over 31 million triples [tuples]) as a web data integration platform. Consequently, managing and analyzing large and distributed RDF datasets have emerged as an urgent and important concern.**My group's approach to RDF data management and analysis differs from many of the existing approaches that map, in one way or another, RDF into a relational representation and convert SPARQL queries into SQL. Although this has the advantage of leveraging mature technology, it gives rise to performance and modeling mismatch problems. We model an RDF dataset as a graph (which is the native model for RDF) and also represent a SPARQL query as a graph. Consequently, query execution reduces to graph matching. This approach has modeling and performance advantages. Within this general approach, I intend to study the following issues over the next five years:**1. Efficient storage structures for RDF graphs.*2. Efficient and effective query processing and optimization techniques for SPARQL queries (including aggregation queries that are now part of the SPARQL standard).*3. Distribution of RDF graphs and evaluation of SPARQL queries over distributed RDF stores.*4. Web data querying and integration using RDF, which requires some reasoning capability over RDF data (so called OWL 2 entailment regime).**The methodology that will be followed includes algorithmic studies, development of prototype systems, and extensive experimentation.**Successful completion of this research will result in the development of efficient and effective techniques for RDF data management, and web data integration and querying through RDF. Since RDF technology is now widely deployed (including by various levels of government at a number of countries), the results will have significant impact both technically and societally.
图形数据在语义网、社会网络分析、生物信息学和物理通信网络等许多应用中越来越重要。图自然地模拟了这些领域的复杂结构,例如社会网络或蛋白质-蛋白质相互作用网络中人与人之间的关系。这些图形数据的规模和复杂性给数据管理和数据分析带来了重大挑战。我广泛的研究范围就是对这些问题的研究。**在这个发现项目中,我的重点是来自Web资源模型的图结构。资源描述框架(RDF)是一个标准(由W3C提出),Web对象通常通过它来建模。RDF是一种自描述数据模型,适合于机器理解和解释,因此有望促进“语义web”。W3C还定义了一种名为SPARQL的查询语言,用于访问RDF存储库。RDF数据集已经开始激增和增长。例如,Yago和DBPedia从Wikipedia中提取事实并以RDF格式存储,以方便对Wikipedia的结构化查询;作为电子政务计划的一部分,许多地方政府现在正在用RDF格式对他们提供给公民的资源进行编码;生物学家已经建立了精细的RDF数据集合(BioRDF和Uniprot RDF),用于实验数据的社区共享;链接开放数据(LOD)作为一个网络数据集成平台正在不断发展壮大(截至2011年9月——这是最新的可用信息——超过3100万个三元组)。因此,管理和分析大型分布式RDF数据集已成为一个紧迫而重要的问题。**我的小组对RDF数据管理和分析的方法不同于许多现有的方法,这些方法以某种方式将RDF映射为关系表示,并将SPARQL查询转换为SQL。尽管这具有利用成熟技术的优势,但它会产生性能和建模不匹配的问题。我们将RDF数据集建模为图(这是RDF的本机模型),并将SPARQL查询表示为图。因此,查询执行简化为图匹配。这种方法具有建模和性能方面的优势。在这一总体方针下,我打算在未来五年研究以下问题:**1。RDF图的高效存储结构。*2。SPARQL查询(包括聚合查询,现在是SPARQL标准的一部分)的高效和有效的查询处理和优化技术。RDF图的分布和分布RDF存储上SPARQL查询的评估。使用RDF查询和集成Web数据,这需要对RDF数据有一定的推理能力(所谓的owl2蕴涵机制)。**将遵循的方法包括算法研究、原型系统的开发和广泛的实验。**本研究的成功完成将导致RDF数据管理以及通过RDF进行web数据集成和查询的高效和有效技术的发展。由于RDF技术现在被广泛部署(包括许多国家的各级政府),其结果将在技术和社会方面产生重大影响。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Ozsu, MTamer其他文献

Ozsu, MTamer的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Ozsu, MTamer', 18)}}的其他基金

Highly Scalable Graph Processing
高度可扩展的图形处理
  • 批准号:
    RGPIN-2019-04061
  • 财政年份:
    2022
  • 资助金额:
    $ 3.93万
  • 项目类别:
    Discovery Grants Program - Individual
Scaling-Out Streaming Graph Processing
横向扩展流图处理
  • 批准号:
    538924-2019
  • 财政年份:
    2021
  • 资助金额:
    $ 3.93万
  • 项目类别:
    Collaborative Research and Development Grants
Highly Scalable Graph Processing
高度可扩展的图形处理
  • 批准号:
    RGPIN-2019-04061
  • 财政年份:
    2021
  • 资助金额:
    $ 3.93万
  • 项目类别:
    Discovery Grants Program - Individual
Scaling-Out Streaming Graph Processing
横向扩展流图处理
  • 批准号:
    538924-2019
  • 财政年份:
    2020
  • 资助金额:
    $ 3.93万
  • 项目类别:
    Collaborative Research and Development Grants
Highly Scalable Graph Processing
高度可扩展的图形处理
  • 批准号:
    RGPIN-2019-04061
  • 财政年份:
    2020
  • 资助金额:
    $ 3.93万
  • 项目类别:
    Discovery Grants Program - Individual
Scaling-Out Streaming Graph Processing
横向扩展流图处理
  • 批准号:
    538924-2019
  • 财政年份:
    2019
  • 资助金额:
    $ 3.93万
  • 项目类别:
    Collaborative Research and Development Grants
Highly Scalable Graph Processing
高度可扩展的图形处理
  • 批准号:
    RGPIN-2019-04061
  • 财政年份:
    2019
  • 资助金额:
    $ 3.93万
  • 项目类别:
    Discovery Grants Program - Individual

相似国自然基金

Scalable Learning and Optimization: High-dimensional Models and Online Decision-Making Strategies for Big Data Analysis
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    万元
  • 项目类别:
    合作创新研究团队
Data-driven Recommendation System Construction of an Online Medical Platform Based on the Fusion of Information
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    万元
  • 项目类别:
    外国青年学者研究基金项目
Development of a Linear Stochastic Model for Wind Field Reconstruction from Limited Measurement Data
  • 批准号:
  • 批准年份:
    2020
  • 资助金额:
    40 万元
  • 项目类别:
基于Linked Open Data的Web服务语义互操作关键技术
  • 批准号:
    61373035
  • 批准年份:
    2013
  • 资助金额:
    77.0 万元
  • 项目类别:
    面上项目
Molecular Interaction Reconstruction of Rheumatoid Arthritis Therapies Using Clinical Data
  • 批准号:
    31070748
  • 批准年份:
    2010
  • 资助金额:
    34.0 万元
  • 项目类别:
    面上项目
高维数据的函数型数据(functional data)分析方法
  • 批准号:
    11001084
  • 批准年份:
    2010
  • 资助金额:
    16.0 万元
  • 项目类别:
    青年科学基金项目
染色体复制负调控因子datA在细胞周期中的作用
  • 批准号:
    31060015
  • 批准年份:
    2010
  • 资助金额:
    25.0 万元
  • 项目类别:
    地区科学基金项目
Computational Methods for Analyzing Toponome Data
  • 批准号:
    60601030
  • 批准年份:
    2006
  • 资助金额:
    17.0 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Collaborative Research: Fusion of Siloed Data for Multistage Manufacturing Systems: Integrative Product Quality and Machine Health Management
协作研究:多级制造系统的孤立数据融合:集成产品质量和机器健康管理
  • 批准号:
    2323083
  • 财政年份:
    2024
  • 资助金额:
    $ 3.93万
  • 项目类别:
    Standard Grant
Secure Management of Internet of Things Data for Critical Surveillance
关键监控物联网数据的安全管理
  • 批准号:
    LP230100276
  • 财政年份:
    2024
  • 资助金额:
    $ 3.93万
  • 项目类别:
    Linkage Projects
PFI-TT: A Hybrid Scalable Data Management System Providing Deep Access to the Scientific Knowledge in Data Science
PFI-TT:混合可扩展数据管理系统,提供对数据科学中科学知识的深入访问
  • 批准号:
    2345794
  • 财政年份:
    2024
  • 资助金额:
    $ 3.93万
  • 项目类别:
    Continuing Grant
Collaborative Research: Fusion of Siloed Data for Multistage Manufacturing Systems: Integrative Product Quality and Machine Health Management
协作研究:多级制造系统的孤立数据融合:集成产品质量和机器健康管理
  • 批准号:
    2323084
  • 财政年份:
    2024
  • 资助金额:
    $ 3.93万
  • 项目类别:
    Standard Grant
Collaborative Research: Fusion of Siloed Data for Multistage Manufacturing Systems: Integrative Product Quality and Machine Health Management
协作研究:多级制造系统的孤立数据融合:集成产品质量和机器健康管理
  • 批准号:
    2323082
  • 财政年份:
    2024
  • 资助金额:
    $ 3.93万
  • 项目类别:
    Standard Grant
Decentralised Data Management for Edge Caching Systems in 5G
5G 边缘缓存系统的分散式数据管理
  • 批准号:
    LP210301393
  • 财政年份:
    2023
  • 资助金额:
    $ 3.93万
  • 项目类别:
    Linkage Projects
Intelligent sensing and data fusion in a smart environment for human activity recognition to support self-management of long-term conditions
智能环境中的智能传感和数据融合,用于人类活动识别,支持长期状况的自我管理
  • 批准号:
    2888131
  • 财政年份:
    2023
  • 资助金额:
    $ 3.93万
  • 项目类别:
    Studentship
Collaborative Research: CCF Core: Small: User-transparent Data Management for Persistence and Crash-consistency in Non-volatile Memories
协作研究:CCF 核心:小型:用户透明的数据管理,以实现非易失性存储器中的持久性和崩溃一致性
  • 批准号:
    2313146
  • 财政年份:
    2023
  • 资助金额:
    $ 3.93万
  • 项目类别:
    Standard Grant
Collaborative Research: Elements: ProDM: Developing A Unified Progressive Data Management Library for Exascale Computational Science
协作研究:要素:ProDM:为百亿亿次计算科学开发统一的渐进式数据管理库
  • 批准号:
    2311757
  • 财政年份:
    2023
  • 资助金额:
    $ 3.93万
  • 项目类别:
    Standard Grant
EAGER: SMART-DMSP: Streamlining Metadata, Automation, and Research Tracking for Data Management and Sharing Plans
EAGER:SMART-DMSP:简化数据管理和共享计划的元数据、自动化和研究跟踪
  • 批准号:
    2332353
  • 财政年份:
    2023
  • 资助金额:
    $ 3.93万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了