III: Medium: Collaborative Research: A Unified and Declarative Approach to Causal Analysis for Big Data

III:媒介:协作研究:大数据因果分析的统一声明式方法

基本信息

  • 批准号:
    1703331
  • 负责人:
  • 金额:
    $ 40万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2017
  • 资助国家:
    美国
  • 起止时间:
    2017-09-01 至 2021-08-31
  • 项目状态:
    已结题

项目摘要

Observational data is available today in multi-relational form, often extracted from various sources, and stored in multiple flat and interrelated tables. Standard statistical methods for conducting causal inference on observational data assume a very simple data model: a single table with independent units. This research has the potential to significantly impact application domains where differentiating causality from correlation is essential, e.g., education policy and cancer genomics. The HUME project develops techniques for efficient causal analysis using a declarative approach, over complex views, and over large datasets that are integrated from disparate data sources. HUME uses a SQL-like language and is integrated with a relational database system.The project develops techniques for defining arbitrarily complex units, treatments, outcomes, and covariates, by combining joins, data mapping, and aggregates across multiple tables, and uses a causal network to choose a good set of covariates for causal inference. The first part of the project develops scalable techniques for sub-classification and matching for large data sets obtained by declaratively integrating multiple data sources. The second part of the project develops scalable methods for discovering causal relationships among the attributes in the views by constraint-based, search-based, and hybrid discovery processes. Finally, the third part of the project investigates interferences among units arising from the complex views by designing normal forms and automatic inference of underlying assumptions exploiting techniques from database theory.
如今,观测数据以多关系形式提供,通常从各种来源提取,并存储在多个平面和相互关联的表中。 对观测数据进行因果推断的标准统计方法假设一个非常简单的数据模型:一个具有独立单位的单一表格。 这项研究有可能对区分因果关系和相关性至关重要的应用领域产生重大影响,例如,教育政策和癌症基因组学。HUME项目开发了使用声明式方法进行有效因果分析的技术,用于复杂视图和从不同数据源集成的大型数据集。 HUME使用一种类似SQL的语言,并与关系数据库系统集成。该项目开发了定义任意复杂单位,处理,结果和协变量的技术,通过组合连接,数据映射和多个表的聚合,并使用因果网络选择一组良好的协变量进行因果推理。 该项目的第一部分开发了可扩展的技术,用于通过声明性地集成多个数据源获得的大型数据集的子分类和匹配。 该项目的第二部分开发了可扩展的方法,通过基于约束的,基于搜索的和混合的发现过程来发现视图中属性之间的因果关系。最后,该项目的第三部分调查的单位之间的干扰所产生的复杂的意见,通过设计规范形式和自动推理的基本假设,利用技术从数据库理论。

项目成果

期刊论文数量(23)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Collective Alignment of Large-Scale Ontologies
大规模本体的集体对齐
Contrastive Entity Linkage: Mining Variational Attributes from Large Catalogs for Entity Linkage
  • DOI:
    10.24432/c5w88r
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Varun R. Embar;Bunyamin Sisman;Hao Wei;Xin Dong;C. Faloutsos;L. Getoor
  • 通讯作者:
    Varun R. Embar;Bunyamin Sisman;Hao Wei;Xin Dong;C. Faloutsos;L. Getoor
BOWL: Bayesian Optimization for Weight Learning in Probabilistic Soft Logic
  • DOI:
    10.1609/aaai.v34i06.6589
  • 发表时间:
    2020-04
  • 期刊:
  • 影响因子:
    0
  • 作者:
    S. Srinivasan;G. Farnadi;L. Getoor
  • 通讯作者:
    S. Srinivasan;G. Farnadi;L. Getoor
Collective Bio-Entity Recognition in Scientific Documents using Hinge-Loss Markov Random Fields
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    A. Miller
  • 通讯作者:
    A. Miller
Scalable Probabilistic Causal Structure Discovery
  • DOI:
    10.24963/ijcai.2018/709
  • 发表时间:
    2018-07
  • 期刊:
  • 影响因子:
    1
  • 作者:
    Dhanya Sridhar;J. Pujara;L. Getoor
  • 通讯作者:
    Dhanya Sridhar;J. Pujara;L. Getoor
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Lise Getoor其他文献

Collective Grounding: Applying Database Techniques to Grounding Templated Models
集体接地:将数据库技术应用于接地模板模型
Soft quantification in statistical relational learning
  • DOI:
    10.1007/s10994-017-5647-3
  • 发表时间:
    2017-07-12
  • 期刊:
  • 影响因子:
    2.900
  • 作者:
    Golnoosh Farnadi;Stephen H. Bach;Marie-Francine Moens;Lise Getoor;Martine De Cock
  • 通讯作者:
    Martine De Cock
Research Challenges and Opportunities in Knowledge Representation
知识表示的研究挑战和机遇
  • DOI:
  • 发表时间:
    2013
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Natasha Noy;Deborah L. McGuinness;Eyal Amir;Chitta Baral;Michael Beetz;S. Bechhofer;C. Boutilier;Anthony Cohn;J. Kleer;Michel Dumontier;Tim Finin;Kenneth D. Forbus;Lise Getoor;Yolanda Gil;J. Heflin;P. Hitzler;Craig A. Knoblock;Henry Kautz;Yuliya Lierler;Vladimir Lifschitz;Peter F. Patel;C. Piatko;D. Riecken;M. Schildhauer
  • 通讯作者:
    M. Schildhauer

Lise Getoor的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Lise Getoor', 18)}}的其他基金

TRIPODS: Institute for Foundations of Data Science
TRIPODS:数据科学研究所
  • 批准号:
    2023495
  • 财政年份:
    2020
  • 资助金额:
    $ 40万
  • 项目类别:
    Continuing Grant
TRIPODS: Towards a Unified Theory of Structure, Incompleteness & Uncertainty in Heterogeneous Graphs
TRIPODS:迈向结构、不完备性的统一理论
  • 批准号:
    1740850
  • 财政年份:
    2017
  • 资助金额:
    $ 40万
  • 项目类别:
    Continuing Grant
III: Small: A Theoretical Framework for Practical Entity Resolution in Network Data
III:小:网络数据中实际实体解析的理论框架
  • 批准号:
    1218488
  • 财政年份:
    2012
  • 资助金额:
    $ 40万
  • 项目类别:
    Standard Grant
FODAVA: Collaborative Research: Foundations of Comparative Analytics for Uncertainty in Graphs
FODAVA:协作研究:图形不确定性比较分析的基础
  • 批准号:
    0937094
  • 财政年份:
    2009
  • 资助金额:
    $ 40万
  • 项目类别:
    Standard Grant
Student Poster Program and Travel Scholarships for International Conference on Machine Learning (ICML) 2009
2009 年国际机器学习会议 (ICML) 学生海报计划和旅行奖学金
  • 批准号:
    0935087
  • 财政年份:
    2009
  • 资助金额:
    $ 40万
  • 项目类别:
    Standard Grant
CAREER: Graph Identification
职业:图形识别
  • 批准号:
    0746930
  • 财政年份:
    2008
  • 资助金额:
    $ 40万
  • 项目类别:
    Continuing Grant
Student Poster Program and Travel Scholarships for ICML 2008
ICML 2008 学生海报计划和旅行奖学金
  • 批准号:
    0830962
  • 财政年份:
    2008
  • 资助金额:
    $ 40万
  • 项目类别:
    Standard Grant
SoD: Data and Meta-Data Integration Maintenance
SoD:数据和元数据集成维护
  • 批准号:
    0438866
  • 财政年份:
    2005
  • 资助金额:
    $ 40万
  • 项目类别:
    Standard Grant
Link Mining and Discovery
链接挖掘和发现
  • 批准号:
    0308030
  • 财政年份:
    2003
  • 资助金额:
    $ 40万
  • 项目类别:
    Standard Grant

相似海外基金

III : Medium: Collaborative Research: From Open Data to Open Data Curation
III:媒介:协作研究:从开放数据到开放数据管理
  • 批准号:
    2420691
  • 财政年份:
    2024
  • 资助金额:
    $ 40万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Medium: Designing AI Systems with Steerable Long-Term Dynamics
合作研究:III:中:设计具有可操纵长期动态的人工智能系统
  • 批准号:
    2312865
  • 财政年份:
    2023
  • 资助金额:
    $ 40万
  • 项目类别:
    Standard Grant
Collaborative Research: III: MEDIUM: Responsible Design and Validation of Algorithmic Rankers
合作研究:III:媒介:算法排序器的负责任设计和验证
  • 批准号:
    2312932
  • 财政年份:
    2023
  • 资助金额:
    $ 40万
  • 项目类别:
    Standard Grant
III: Medium: Collaborative Research: Integrating Large-Scale Machine Learning and Edge Computing for Collaborative Autonomous Vehicles
III:媒介:协作研究:集成大规模机器学习和边缘计算以实现协作自动驾驶汽车
  • 批准号:
    2348169
  • 财政年份:
    2023
  • 资助金额:
    $ 40万
  • 项目类别:
    Continuing Grant
Collaborative Research: III: Medium: Algorithms for scalable inference and phylodynamic analysis of tumor haplotypes using low-coverage single cell sequencing data
合作研究:III:中:使用低覆盖率单细胞测序数据对肿瘤单倍型进行可扩展推理和系统动力学分析的算法
  • 批准号:
    2415562
  • 财政年份:
    2023
  • 资助金额:
    $ 40万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Medium: New Machine Learning Empowered Nanoinformatics System for Advancing Nanomaterial Design
合作研究:III:媒介:新的机器学习赋能纳米信息学系统,促进纳米材料设计
  • 批准号:
    2347592
  • 财政年份:
    2023
  • 资助金额:
    $ 40万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Medium: Knowledge discovery from highly heterogeneous, sparse and private data in biomedical informatics
合作研究:III:中:生物医学信息学中高度异构、稀疏和私有数据的知识发现
  • 批准号:
    2312862
  • 财政年份:
    2023
  • 资助金额:
    $ 40万
  • 项目类别:
    Standard Grant
Collaborative Research: III: MEDIUM: Responsible Design and Validation of Algorithmic Rankers
合作研究:III:媒介:算法排序器的负责任设计和验证
  • 批准号:
    2312930
  • 财政年份:
    2023
  • 资助金额:
    $ 40万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Medium: VirtualLab: Integrating Deep Graph Learning and Causal Inference for Multi-Agent Dynamical Systems
协作研究:III:媒介:VirtualLab:集成多智能体动态系统的深度图学习和因果推理
  • 批准号:
    2312501
  • 财政年份:
    2023
  • 资助金额:
    $ 40万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Medium: Graph Neural Networks for Heterophilous Data: Advancing the Theory, Models, and Applications
合作研究:III:媒介:异质数据的图神经网络:推进理论、模型和应用
  • 批准号:
    2406648
  • 财政年份:
    2023
  • 资助金额:
    $ 40万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了