BIGDATA: F: Open-World Foundations for Big Uncertain Data

BIGDATA:F:大不确定数据的开放世界基础

基本信息

  • 批准号:
    1633857
  • 负责人:
  • 金额:
    $ 43.22万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2016
  • 资助国家:
    美国
  • 起止时间:
    2016-09-01 至 2020-08-31
  • 项目状态:
    已结题

项目摘要

Driven by the need to learn from vast amounts of text data, efforts throughout natural language processing, information extraction, databases, and AI are coming together to build large-scale knowledge bases. These systems continuously crawl the web to extract relational data from text, and have already populated their databases with millions of entities and billions of tuples. Large-scale probabilistic knowledge bases are revolutionizing the way we access data. They are now routinely used by scientists to build knowledge bases of publications, by law enforcement to extract information from the dark web, and by regular search engine users who find their results augmented with structured information. Such knowledge bases are inherently probabilistic: to go from raw text to structured data, a sequence of statistical machine learning techniques associate probabilities with database tuples. This project revisits the semantics underlying such systems, and provide a more adequate foundational framework. In particular, the closed-world assumption of probabilistic databases, that facts not in the database have probability zero, clearly conflicts with their everyday use, and obstructs the progress in this area.More specifically, this project develops a new semantic foundation based on the open-world assumption, that facts not in the database are possible, but have unknown probability. It designs the basic algorithms for query answering in this setting, both exact and approximate. Moreover, in a deep theoretical component, this project studies fundamental questions of data and domain complexity that are unique to open-world reasoning about big uncertain data. Finally it develops proof-of-concept applications in machine learning and data mining, and additional knowledge-representation layers that strengthen open-world reasoning. The developed semantics provide meaningful answers when some tuple probabilities are not precisely known. The developed algorithms allow for efficient query answering, even when reasoning about the open world, in time linear in the database size for tractable queries. This project provides a scientific leap at the fundamental, semantic level. It also provides a context for training undergraduate and graduate students in subjects spanning databases, artificial intelligence, theory, and machine learning, and will target the integration of probabilistic knowledge bases into computer science curricula.
在从大量文本数据中学习的需求的推动下,自然语言处理、信息提取、数据库和人工智能正在共同努力构建大规模的知识库。这些系统不断地抓取网络以从文本中提取关系数据,并且已经在其数据库中填充了数百万个实体和数十亿个元组。大规模概率知识库正在彻底改变我们访问数据的方式。现在,科学家经常使用它们来建立出版物的知识库,执法部门使用它们从暗网上提取信息,普通搜索引擎用户则发现他们的结果增加了结构化信息。这样的知识库本质上是概率性的:为了从原始文本到结构化数据,一系列统计机器学习技术将概率与数据库元组相关联。该项目重新审视了此类系统背后的语义,并提供了更充分的基础框架。特别是概率数据库的封闭世界假设,即不在数据库中的事实的概率为零,显然与其日常使用相冲突,并阻碍了该领域的进展。更具体地说,该项目基于开放世界假设开发了一个新的语义基础,即不在数据库中的事实是可能的,但具有未知的概率。它设计了在此设置中进行查询应答的基本算法,包括精确的和近似的。此外,在深入的理论部分,该项目研究了数据和领域复杂性的基本问题,这些问题是关于大不确定数据的开放世界推理所特有的。最后,它开发了机器学习和数据挖掘中的概念验证应用程序,以及增强开放世界推理的附加知识表示层。当某些元组概率未知时,所开发的语义提供了有意义的答案。所开发的算法可以实现高效的查询应答,即使在推理开放世界时,也可以在时间上与数据库大小呈线性关系,以实现易于处理的查询。该项目在基础语义层面上实现了科学飞跃。它还为培训本科生和研究生提供数据库、人工智能、理论和机器学习等学科的背景,并将目标是将概率知识库整合到计算机科学课程中。

项目成果

期刊论文数量(11)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Symbolic Querying of Vector Spaces: Probabilistic Databases Meets Relational Embeddings
  • DOI:
  • 发表时间:
    2020-02
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Tal Friedman;Guy Van den Broeck
  • 通讯作者:
    Tal Friedman;Guy Van den Broeck
New Liftable Classes for First-Order Probabilistic Inference
用于一阶概率推理的新可提升类
On Tractable Computation of Expected Predictions
  • DOI:
  • 发表时间:
    2019-10
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Pasha Khosravi;YooJung Choi;Yitao Liang;Antonio Vergari;Guy Van den Broeck
  • 通讯作者:
    Pasha Khosravi;YooJung Choi;Yitao Liang;Antonio Vergari;Guy Van den Broeck
On Constrained Open-World Probabilistic Databases
  • DOI:
    10.24963/ijcai.2019/793
  • 发表时间:
    2018-11
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Tal Friedman;Guy Van den Broeck
  • 通讯作者:
    Tal Friedman;Guy Van den Broeck
Scalable Rule Learning in Probabilistic Knowledge Bases
  • DOI:
    10.24432/c5mw26
  • 发表时间:
    2019-05
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Arcchit Jain;Tal Friedman;Ondřej Kuželka;Guy Van den Broeck;L. D. Raedt
  • 通讯作者:
    Arcchit Jain;Tal Friedman;Ondřej Kuželka;Guy Van den Broeck;L. D. Raedt
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Guy Van den Broeck其他文献

Compiling probabilistic logic programs into sentential decision diagrams
将概率逻辑程序编译成句子决策图
  • DOI:
  • 发表时间:
    2014
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Jonas Vlasselaer;Joris Renkens;Guy Van den Broeck;L. D. Raedt
  • 通讯作者:
    L. D. Raedt
A Tractable Inference Perspective of Offline RL
离线强化学习的易于处理的推理视角
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Xuejie Liu;Anji Liu;Guy Van den Broeck;Yitao Liang
  • 通讯作者:
    Yitao Liang
Lifted Inference and Learning in Statistical Relational Models
A I ] 2 8 M ay 2 01 7 Probabilistic Program Abstractions
AI ] 2 8 May 2 01 7 概率程序抽象
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Steven Holtzen;T. Millstein;Guy Van den Broeck
  • 通讯作者:
    Guy Van den Broeck
An Algebraic Prolog for Reasoning about Possible Worlds
推理可能世界的代数序言

Guy Van den Broeck的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Guy Van den Broeck', 18)}}的其他基金

Collaborative Research: RI: AF: Medium: Exchanging Knowledge Beyond Data Between Human and Machine Learner
协作研究:RI:AF:媒介:在人类和机器学习者之间交换数据之外的知识
  • 批准号:
    1956441
  • 财政年份:
    2020
  • 资助金额:
    $ 43.22万
  • 项目类别:
    Standard Grant
CAREER: Towards a New Synthesis of Statistical Learning and Logical Reasoning
职业:迈向统计学习和逻辑推理的新综合
  • 批准号:
    1943641
  • 财政年份:
    2020
  • 资助金额:
    $ 43.22万
  • 项目类别:
    Continuing Grant
CRII: RI: Inference for Probabilistic Programs: A Symbolic Approach
CRII:RI:概率程序的推理:符号方法
  • 批准号:
    1657613
  • 财政年份:
    2017
  • 资助金额:
    $ 43.22万
  • 项目类别:
    Standard Grant

相似国自然基金

精子发生中mRNA下游开放阅读框(downstream Open Reading Frame,dORF)的功能研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    54 万元
  • 项目类别:
    面上项目
基于升阶谱方法和Open CASCADE的高阶网格自动生成技术研究
  • 批准号:
    11972004
  • 批准年份:
    2019
  • 资助金额:
    62.0 万元
  • 项目类别:
    面上项目
基于Linked Open Data的Web服务语义互操作关键技术
  • 批准号:
    61373035
  • 批准年份:
    2013
  • 资助金额:
    77.0 万元
  • 项目类别:
    面上项目
变分与拓扑方法和Schrodinger方程中的Open 问题
  • 批准号:
    10871109
  • 批准年份:
    2008
  • 资助金额:
    23.0 万元
  • 项目类别:
    面上项目

相似海外基金

能動的Open-world認識による知識拡張・環境認識基盤の構築
通过主动的开放世界识别扩展知识并构建环境识别基础设施
  • 批准号:
    24H00733
  • 财政年份:
    2024
  • 资助金额:
    $ 43.22万
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)
Unifying Object Detection and Image Captioning using Vision-Language Knowledge Base for Open-World Comprehension
使用视觉语言知识库统一对象检测和图像描述以实现开放世界理解
  • 批准号:
    24K20830
  • 财政年份:
    2024
  • 资助金额:
    $ 43.22万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
Open Access Block Award 2024 - World Conservation Monitoring Cen WCMC
2024 年开放获取区块奖 - 世界保护监测中心 WCMC
  • 批准号:
    EP/Z533087/1
  • 财政年份:
    2024
  • 资助金额:
    $ 43.22万
  • 项目类别:
    Research Grant
Open-world computer vision by detecting and tracking hierarchical objects
通过检测和跟踪分层对象来实现开放世界计算机视觉
  • 批准号:
    DE240100967
  • 财政年份:
    2024
  • 资助金额:
    $ 43.22万
  • 项目类别:
    Discovery Early Career Researcher Award
CAREER: Towards Open World Event Knowledge Extraction with Weak Supervision
职业:在弱监督下实现开放世界事件知识提取
  • 批准号:
    2238940
  • 财政年份:
    2023
  • 资助金额:
    $ 43.22万
  • 项目类别:
    Continuing Grant
NeuroWellbeing Immersive Tech: AI-enabled, Augmented-Reality, 3D open world, immersive educational mobile games
NeuroWellbeing沉浸式技术:人工智能、增强现实、3D开放世界、沉浸式教育手机游戏
  • 批准号:
    10054612
  • 财政年份:
    2023
  • 资助金额:
    $ 43.22万
  • 项目类别:
    Collaborative R&D
Collaborative Research: III: Small: Taming Large-Scale Streaming Graphs in an Open World
协作研究:III:小型:在开放世界中驯服大规模流图
  • 批准号:
    2236578
  • 财政年份:
    2023
  • 资助金额:
    $ 43.22万
  • 项目类别:
    Standard Grant
Open Access Block Award 2023 - World Conservation Monitoring Cen WCMC
2023 年开放获取区块奖 - 世界保护监测中心 WCMC
  • 批准号:
    EP/Y530013/1
  • 财政年份:
    2023
  • 资助金额:
    $ 43.22万
  • 项目类别:
    Research Grant
CAREER: Visual Learning in an Open and Continual World
职业:开放和持续世界中的视觉学习
  • 批准号:
    2239292
  • 财政年份:
    2023
  • 资助金额:
    $ 43.22万
  • 项目类别:
    Continuing Grant
Collaborative Research: III: Small: Taming Large-Scale Streaming Graphs in an Open World
协作研究:III:小型:在开放世界中驯服大规模流图
  • 批准号:
    2236579
  • 财政年份:
    2023
  • 资助金额:
    $ 43.22万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了