Causality in Data Management: Foundations and Applications

数据管理中的因果关系:基础和应用

基本信息

  • 批准号:
    RGPIN-2016-06148
  • 负责人:
  • 金额:
    $ 2.26万
  • 依托单位:
  • 依托单位国家:
    加拿大
  • 项目类别:
    Discovery Grants Program - Individual
  • 财政年份:
    2016
  • 资助国家:
    加拿大
  • 起止时间:
    2016-01-01 至 2017-12-31
  • 项目状态:
    已结题

项目摘要

Trying to understand why and how the occurrence of an event or the execution of an action affect other events or properties of objects belongs to the essence of human existence. If the search for causal explanations is not the oldest activity performed by humans, it is certainly one of them, yet it still has been an elusive concept that has been studied in many fields of knowledge, ranging from philosophy to computer science. In these times of big data and data science, analyzing large volumes of data has become an increasingly common and complex problem. Beyond the traditional problem of extracting explicit data from a data source, it has become crucial to understand and make sense of the data, and extract implicit knowledge from such a source. In particular, finding explanations for data phenomena as shown, for example, in query answers, satisfaction or violation of semantic constraints, and view contents, has been identified as an important task, for which explanation models, algorithmic results, and practical computational implementations still need to be developed. Causality is used to address the problem of providing explanations for different forms of manifestations of data. Although causality has been investigated in several areas, e.g. statistics, artificial intelligence, economics, its emergence in data management, and databases in particular, is quite recent. Addressing causality in databases requires a mathematical characterization of the notion of cause, the investigation of the mathematical model, and the algorithmic and complexity analysis of computational problems. Among the latter, we find development of efficient algorithms for computing causes for query answers, whenever possible, or of efficient approximation algorithms when the intrinsic complexity of the problem is high. It also becomes necessary to rank causes, identifying those most relevant, for which the notion of responsibility has been introduced. Several computational problems emerge around responsibility computation. The PI has already obtained interesting results in this area. However, many aspects and problems of causality in databases, and more generally in data management, are still open. In this proposal we address causality in the context of semantically enriched data sources, with the aim to propose and investigate a model of causality in scenarios such as ontology-based data access, virtual data integration, and multidimensional databases, among others. We also go into more fundamental problems, such as the logical characterization of causes, which should tell us what theory embedding the data source can be used to infer causes and how. We investigate the problem of learning causal relations from (possibly probabilistic) data sources, by developing machine learning methods specifically tailored for databases, which normally lack the additional semantic information that is useful for learning.
试图理解一个事件的发生或一个动作的执行为什么以及如何影响其他事件或对象的属性属于人类存在的本质。如果寻找因果解释不是人类进行的最古老的活动,它当然是其中之一,但它仍然是一个难以捉摸的概念,已经在从哲学到计算机科学的许多知识领域进行了研究。 在这个大数据和数据科学的时代,分析海量数据已经成为一个日益普遍和复杂的问题。除了从数据源中提取显式数据的传统问题之外,理解和理解数据并从这样的源中提取隐含的知识变得至关重要。特别是,为例如在查询答案、满足或违反语义约束和查看内容中所示的数据现象找到解释已经被确定为一项重要的任务,对于该任务,仍然需要开发解释模型、算法结果和实际计算实现。因果关系被用来解决为不同形式的数据表现提供解释的问题。 虽然已经在统计学、人工智能、经济学等几个领域对因果关系进行了研究,但它在数据管理、特别是数据库中的出现是最近才出现的。解决数据库中的因果关系需要对原因概念进行数学描述,对数学模型进行调查,并对计算问题进行算法和复杂性分析。在后者中,我们发现在可能的情况下用于计算查询答案的原因的高效算法的发展,或者当问题的内在复杂性很高时的高效近似算法的发展。还有必要对已引入责任概念的原因进行排序,找出与之最相关的原因。围绕责任计算出现了几个计算问题。国际和平研究所在这方面已经取得了令人感兴趣的成果。然而,数据库中因果关系的许多方面和问题,更广泛地说,在数据管理中,仍然是悬而未决的。 在这个提案中,我们在语义丰富的数据源的上下文中处理因果关系,目的是提出和研究基于本体的数据访问、虚拟数据集成和多维数据库等场景中的因果关系模型。我们还探讨了更基本的问题,例如原因的逻辑特征,这应该告诉我们嵌入数据源的理论可以用来推断原因以及如何推断原因。我们通过开发专门为数据库定制的机器学习方法来研究从(可能是概率的)数据源学习因果关系的问题,这些数据库通常缺乏对学习有用的额外语义信息。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Bertossi, Leopoldo其他文献

ERBlox: Combining matching dependencies with machine learning for entity resolution
Specifying and computing causes for query answers in databases via database repairs and repair-programs
  • DOI:
    10.1007/s10115-020-01516-6
  • 发表时间:
    2020-11-03
  • 期刊:
  • 影响因子:
    2.7
  • 作者:
    Bertossi, Leopoldo
  • 通讯作者:
    Bertossi, Leopoldo

Bertossi, Leopoldo的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Bertossi, Leopoldo', 18)}}的其他基金

Causality in Data Management: Foundations and Applications
数据管理中的因果关系:基础和应用
  • 批准号:
    RGPIN-2016-06148
  • 财政年份:
    2019
  • 资助金额:
    $ 2.26万
  • 项目类别:
    Discovery Grants Program - Individual
Causality in Data Management: Foundations and Applications
数据管理中的因果关系:基础和应用
  • 批准号:
    RGPIN-2016-06148
  • 财政年份:
    2018
  • 资助金额:
    $ 2.26万
  • 项目类别:
    Discovery Grants Program - Individual
Causality in Data Management: Foundations and Applications
数据管理中的因果关系:基础和应用
  • 批准号:
    RGPIN-2016-06148
  • 财政年份:
    2017
  • 资助金额:
    $ 2.26万
  • 项目类别:
    Discovery Grants Program - Individual
Network data analysis for security standard compliance
网络数据分析以确保安全标准合规性
  • 批准号:
    477517-2015
  • 财政年份:
    2015
  • 资助金额:
    $ 2.26万
  • 项目类别:
    Engage Grants Program
Contexts as metadata for data management
上下文作为数据管理的元数据
  • 批准号:
    250279-2011
  • 财政年份:
    2015
  • 资助金额:
    $ 2.26万
  • 项目类别:
    Discovery Grants Program - Individual
Retrieval, management and analysis of data from audio and video transcripts
音频和视频记录数据的检索、管理和分析
  • 批准号:
    485017-2015
  • 财政年份:
    2015
  • 资助金额:
    $ 2.26万
  • 项目类别:
    Engage Grants Program
Contexts as metadata for data management
上下文作为数据管理的元数据
  • 批准号:
    250279-2011
  • 财政年份:
    2014
  • 资助金额:
    $ 2.26万
  • 项目类别:
    Discovery Grants Program - Individual
Contexts as metadata for data management
上下文作为数据管理的元数据
  • 批准号:
    250279-2011
  • 财政年份:
    2013
  • 资助金额:
    $ 2.26万
  • 项目类别:
    Discovery Grants Program - Individual
Contexts as metadata for data management
上下文作为数据管理的元数据
  • 批准号:
    250279-2011
  • 财政年份:
    2012
  • 资助金额:
    $ 2.26万
  • 项目类别:
    Discovery Grants Program - Individual
Contexts as metadata for data management
上下文作为数据管理的元数据
  • 批准号:
    250279-2011
  • 财政年份:
    2011
  • 资助金额:
    $ 2.26万
  • 项目类别:
    Discovery Grants Program - Individual

相似国自然基金

Data-driven Recommendation System Construction of an Online Medical Platform Based on the Fusion of Information
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    万元
  • 项目类别:
    外国青年学者研究基金项目
Scalable Learning and Optimization: High-dimensional Models and Online Decision-Making Strategies for Big Data Analysis
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    万元
  • 项目类别:
    合作创新研究团队
Development of a Linear Stochastic Model for Wind Field Reconstruction from Limited Measurement Data
  • 批准号:
  • 批准年份:
    2020
  • 资助金额:
    40 万元
  • 项目类别:
基于Linked Open Data的Web服务语义互操作关键技术
  • 批准号:
    61373035
  • 批准年份:
    2013
  • 资助金额:
    77.0 万元
  • 项目类别:
    面上项目
Molecular Interaction Reconstruction of Rheumatoid Arthritis Therapies Using Clinical Data
  • 批准号:
    31070748
  • 批准年份:
    2010
  • 资助金额:
    34.0 万元
  • 项目类别:
    面上项目
高维数据的函数型数据(functional data)分析方法
  • 批准号:
    11001084
  • 批准年份:
    2010
  • 资助金额:
    16.0 万元
  • 项目类别:
    青年科学基金项目
染色体复制负调控因子datA在细胞周期中的作用
  • 批准号:
    31060015
  • 批准年份:
    2010
  • 资助金额:
    25.0 万元
  • 项目类别:
    地区科学基金项目
Computational Methods for Analyzing Toponome Data
  • 批准号:
    60601030
  • 批准年份:
    2006
  • 资助金额:
    17.0 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Collaborative Research: Fusion of Siloed Data for Multistage Manufacturing Systems: Integrative Product Quality and Machine Health Management
协作研究:多级制造系统的孤立数据融合:集成产品质量和机器健康管理
  • 批准号:
    2323083
  • 财政年份:
    2024
  • 资助金额:
    $ 2.26万
  • 项目类别:
    Standard Grant
Secure Management of Internet of Things Data for Critical Surveillance
关键监控物联网数据的安全管理
  • 批准号:
    LP230100276
  • 财政年份:
    2024
  • 资助金额:
    $ 2.26万
  • 项目类别:
    Linkage Projects
PFI-TT: A Hybrid Scalable Data Management System Providing Deep Access to the Scientific Knowledge in Data Science
PFI-TT:混合可扩展数据管理系统,提供对数据科学中科学知识的深入访问
  • 批准号:
    2345794
  • 财政年份:
    2024
  • 资助金额:
    $ 2.26万
  • 项目类别:
    Continuing Grant
Collaborative Research: Fusion of Siloed Data for Multistage Manufacturing Systems: Integrative Product Quality and Machine Health Management
协作研究:多级制造系统的孤立数据融合:集成产品质量和机器健康管理
  • 批准号:
    2323084
  • 财政年份:
    2024
  • 资助金额:
    $ 2.26万
  • 项目类别:
    Standard Grant
Collaborative Research: Fusion of Siloed Data for Multistage Manufacturing Systems: Integrative Product Quality and Machine Health Management
协作研究:多级制造系统的孤立数据融合:集成产品质量和机器健康管理
  • 批准号:
    2323082
  • 财政年份:
    2024
  • 资助金额:
    $ 2.26万
  • 项目类别:
    Standard Grant
Decentralised Data Management for Edge Caching Systems in 5G
5G 边缘缓存系统的分散式数据管理
  • 批准号:
    LP210301393
  • 财政年份:
    2023
  • 资助金额:
    $ 2.26万
  • 项目类别:
    Linkage Projects
Intelligent sensing and data fusion in a smart environment for human activity recognition to support self-management of long-term conditions
智能环境中的智能传感和数据融合,用于人类活动识别,支持长期状况的自我管理
  • 批准号:
    2888131
  • 财政年份:
    2023
  • 资助金额:
    $ 2.26万
  • 项目类别:
    Studentship
Collaborative Research: CCF Core: Small: User-transparent Data Management for Persistence and Crash-consistency in Non-volatile Memories
协作研究:CCF 核心:小型:用户透明的数据管理,以实现非易失性存储器中的持久性和崩溃一致性
  • 批准号:
    2313146
  • 财政年份:
    2023
  • 资助金额:
    $ 2.26万
  • 项目类别:
    Standard Grant
Collaborative Research: Elements: ProDM: Developing A Unified Progressive Data Management Library for Exascale Computational Science
协作研究:要素:ProDM:为百亿亿次计算科学开发统一的渐进式数据管理库
  • 批准号:
    2311757
  • 财政年份:
    2023
  • 资助金额:
    $ 2.26万
  • 项目类别:
    Standard Grant
EAGER: SMART-DMSP: Streamlining Metadata, Automation, and Research Tracking for Data Management and Sharing Plans
EAGER:SMART-DMSP:简化数据管理和共享计划的元数据、自动化和研究跟踪
  • 批准号:
    2332353
  • 财政年份:
    2023
  • 资助金额:
    $ 2.26万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了