RI: Small: Modeling Multiple Modalities for Knowledge-Base Construction

RI:小型:知识库构建的多种模式建模

基本信息

  • 批准号:
    1817183
  • 负责人:
  • 金额:
    $ 44.8万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2018
  • 资助国家:
    美国
  • 起止时间:
    2018-08-01 至 2022-07-31
  • 项目状态:
    已结题

项目摘要

Information-rich documents are prevalent in many domains such as news articles, social media posts, online retail pages, healthcare records, financial reports, and scientific papers. Automatically extracting knowledge from such documents is useful in many applications, such as for answering questions, searching the web, automated dialogs, and analyzing trends. Existing machine learning methods focus only on the text in the documents, and ignore other information sources such as images, tables, and numbers. Thus, much of the information is not extracted, leading to incomplete knowledge and incorrect conclusions. This research advances research in machine learning and natural language processing to address these problems. With support for accurate extraction and reasoning, this project will pave the way for novel applications to domains with unstructured, multimodal documents.The specific aim of the project is to investigate a novel construction pipeline for knowledge bases, taking the first steps in combining textual and relational evidence with numerical, image, and tabular data. To address the many interconnected challenges therein, the project focuses on two sub-tasks. First, the team will extract new facts about an entity from a document, such as its attributes, by combining the different parts (text, images, and tables). Second, the team will develop models to identify missing relations in graphs that contain multimodal facts. For each task, the project includes plans to introduce new datasets, propose benchmark evaluations, and develop appropriate baselines. Further, the team will build upon recent advances in deep neural encoders to investigate machine learning approaches that learn unified, semantic embeddings to model multimodal data. With these contributions, the project will initiate a body of research in machine learning and natural language processing that uses unstructured multimodal data in all its forms for accurate knowledge extraction.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
信息丰富的文档普遍存在于许多领域,如新闻文章、社交媒体帖子、在线零售页面、医疗记录、财务报告和科学论文。从这样的文档中自动提取知识在许多应用程序中都很有用,例如用于回答问题、搜索Web、自动对话和分析趋势。现有的机器学习方法只关注文档中的文本,而忽略了图像、表格和数字等其他信息源。因此,许多信息没有被提取,导致知识不完整和不正确的结论。为了解决这些问题,本研究推进了机器学习和自然语言处理的研究。在对准确提取和推理的支持下,该项目将为非结构化、多模式文档领域的新型应用铺平道路。该项目的具体目标是研究一种新的知识库构建管道,迈出将文本和关系证据与数字、图像和表格数据相结合的第一步。为了应对其中许多相互关联的挑战,该项目侧重于两个子任务。首先,团队将通过组合不同的部分(文本、图像和表格)从文档中提取有关实体的新事实,如其属性。其次,该团队将开发模型,以识别包含多模式事实的图表中缺失的关系。对于每项任务,该项目包括引入新的数据集、提出基准评估和制定适当基线的计划。此外,该团队将以深度神经编码器的最新进展为基础,研究学习统一的语义嵌入来对多模式数据建模的机器学习方法。有了这些贡献,该项目将启动一系列机器学习和自然语言处理的研究,使用各种形式的非结构化多模式数据进行准确的知识提取。该奖项反映了NSF的法定使命,并通过使用基金会的智力优势和更广泛的影响审查标准进行评估,被认为值得支持。

项目成果

期刊论文数量(15)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Tweeki: Linking Named Entities on Twitter to a Knowledge Graph
  • DOI:
    10.18653/v1/2020.wnut-1.29
  • 发表时间:
    2020-11
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Bahareh Harandizadeh;Sameer Singh
  • 通讯作者:
    Bahareh Harandizadeh;Sameer Singh
Knowledge Enhanced Contextual Word Representations
  • DOI:
    10.18653/v1/d19-1005
  • 发表时间:
    2019-09
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Matthew E. Peters;Mark Neumann;IV RobertL.Logan;Roy Schwartz;Vidur Joshi;Sameer Singh;Noah A. Smith-
  • 通讯作者:
    Matthew E. Peters;Mark Neumann;IV RobertL.Logan;Roy Schwartz;Vidur Joshi;Sameer Singh;Noah A. Smith-
Embedding Multimodal Relational Data for Knowledge Base Completion
  • DOI:
    10.18653/v1/d18-1359
  • 发表时间:
    2018-09
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Pouya Pezeshkpour;Liyan Chen;Sameer Singh
  • 通讯作者:
    Pouya Pezeshkpour;Liyan Chen;Sameer Singh
Enforcing Consistency in Weakly Supervised Semantic Parsing
增强弱监督语义解析的一致性
Entity-Based Knowledge Conflicts in Question Answering
  • DOI:
    10.18653/v1/2021.emnlp-main.565
  • 发表时间:
    2021-09
  • 期刊:
  • 影响因子:
    0
  • 作者:
    S. Longpre;Kartik Perisetla;Anthony Chen;Nikhil Ramesh;Chris DuBois;Sameer Singh
  • 通讯作者:
    S. Longpre;Kartik Perisetla;Anthony Chen;Nikhil Ramesh;Chris DuBois;Sameer Singh
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Sameer Singh其他文献

Multi-stage Classification for Audio Based Activity Recognition
基于音频的活动识别的多级分类
  • DOI:
    10.1007/11875581_100
  • 发表时间:
    2006
  • 期刊:
  • 影响因子:
    0
  • 作者:
    José Lopes;Charles Lin;Sameer Singh
  • 通讯作者:
    Sameer Singh
A survey of object recognition methods for automatic asset detection in high-definition video
高清视频中自动资产检测的对象识别方法综述
Skill Set Optimization: Reinforcing Language Model Behavior via Transferable Skills
技能集优化:通过可转移技能强化语言模型行为
  • DOI:
    10.48550/arxiv.2402.03244
  • 发表时间:
    2024
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Kolby Nottingham;Bodhisattwa Prasad Majumder;Bhavana Dalvi;Sameer Singh;Peter Clark;Roy Fox
  • 通讯作者:
    Roy Fox
ezCoref : A Scalable Approach for Collecting Crowdsourced Annotations for Coreference Resolution
ezCoref:一种收集众包注释以进行共指解析的可扩展方法
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    A. Crowdsourced;David Bamman;Olivia Lewke;Rachel Bawden;Rico Sennrich;Alexandra Birch;Ari Bornstein;Arie Cattan;Ido Dagan;Hong Chen;Zhenhua Fan;Hao Lu;Alan Yuille;Eduard Hovy;Mitch Marcus;M. Palmer;Lance;Rodney Huddleston. 2002;Frédéric Landragin;T. Poibeau;Bernard Vic;Belinda Z. Li;Gabriel Stanovsky;Robert L Logan;Andrew McCallum;Sameer Singh
  • 通讯作者:
    Sameer Singh
Modeling Performance of Different Classification Methods : Deviation from the Power Law
不同分类方法的建模性能:偏离幂律
  • DOI:
  • 发表时间:
    2005
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Sameer Singh
  • 通讯作者:
    Sameer Singh

Sameer Singh的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Sameer Singh', 18)}}的其他基金

CAREER: Detecting, Understanding, and Fixing Vulnerabilities in Natural Language Processing Models
职业:检测、理解和修复自然语言处理模型中的漏洞
  • 批准号:
    2046873
  • 财政年份:
    2021
  • 资助金额:
    $ 44.8万
  • 项目类别:
    Continuing Grant
Collaborative Research: RI: Small: Post hoc Explanations in the Wild: Exposing Vulnerabilities and Ensuring Robustness
合作研究:RI:小型:事后解释:暴露漏洞并确保稳健性
  • 批准号:
    2008956
  • 财政年份:
    2020
  • 资助金额:
    $ 44.8万
  • 项目类别:
    Standard Grant
CCRI: ENS: Machine Learning Democratization via a Linked, Annotated Repository of Datasets
CCRI:ENS:通过链接、带注释的数据集存储库实现机器学习民主化
  • 批准号:
    1925741
  • 财政年份:
    2019
  • 资助金额:
    $ 44.8万
  • 项目类别:
    Standard Grant
CRII: RI: Explaining Decisions of Black-box Models via Input Perturbations
CRII:RI:通过输入扰动解释黑盒模型的决策
  • 批准号:
    1756023
  • 财政年份:
    2018
  • 资助金额:
    $ 44.8万
  • 项目类别:
    Standard Grant

相似国自然基金

昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
  • 批准号:
    n/a
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
  • 批准号:
    32000033
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
  • 批准号:
    31972324
  • 批准年份:
    2019
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
  • 批准号:
    81900988
  • 批准年份:
    2019
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
  • 批准号:
    31802058
  • 批准年份:
    2018
  • 资助金额:
    26.0 万元
  • 项目类别:
    青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
  • 批准号:
    31870821
  • 批准年份:
    2018
  • 资助金额:
    56.0 万元
  • 项目类别:
    面上项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
  • 批准号:
    31772128
  • 批准年份:
    2017
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
  • 批准号:
    81704176
  • 批准年份:
    2017
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
  • 批准号:
    91640114
  • 批准年份:
    2016
  • 资助金额:
    85.0 万元
  • 项目类别:
    重大研究计划

相似海外基金

Collaborative Research: RI: Small: Modeling and Learning Ethical Principles for Embedding into Group Decision Support Systems
协作研究:RI:小型:建模和学习嵌入群体决策支持系统的道德原则
  • 批准号:
    2007994
  • 财政年份:
    2021
  • 资助金额:
    $ 44.8万
  • 项目类别:
    Standard Grant
Collaborative Research: RI: Small: Modeling and Learning Ethical Principles for Embedding into Group Decision Support Systems
协作研究:RI:小型:建模和学习嵌入群体决策支持系统的道德原则
  • 批准号:
    2007955
  • 财政年份:
    2021
  • 资助金额:
    $ 44.8万
  • 项目类别:
    Standard Grant
Collaborative Research: RI: Small: Modeling and Learning Ethical Principles for Embedding into Group Decision Support Systems
协作研究:RI:小型:建模和学习嵌入群体决策支持系统的道德原则
  • 批准号:
    2008011
  • 财政年份:
    2021
  • 资助金额:
    $ 44.8万
  • 项目类别:
    Standard Grant
RI: Small: Modeling Co-Decisions: A Computational Framework Using Language and Metadata
RI:小型:共同决策建模:使用语言和元数据的计算框架
  • 批准号:
    2008761
  • 财政年份:
    2020
  • 资助金额:
    $ 44.8万
  • 项目类别:
    Standard Grant
RI: Small: Collaborative Research: Extracting Dynamics from Limited Data for Modeling and Control of Unmanned Autonomous Systems
RI:小型:协作研究:从有限数据中提取动力学,用于无人自主系统的建模和控制
  • 批准号:
    1910308
  • 财政年份:
    2019
  • 资助金额:
    $ 44.8万
  • 项目类别:
    Standard Grant
RI: Small: Collaborative Research: Extracting Dynamics from Limited Data for Modeling and Control of Unmanned Autonomous Systems
RI:小型:协作研究:从有限数据中提取动力学,用于无人自主系统的建模和控制
  • 批准号:
    1910087
  • 财政年份:
    2019
  • 资助金额:
    $ 44.8万
  • 项目类别:
    Standard Grant
NSF-BSF: RI: Small: Collaborative Research: Modeling Crosslinguistic Influences Between Language Varieties
NSF-BSF:RI:小型:协作研究:模拟语言品种之间的跨语言影响
  • 批准号:
    1812778
  • 财政年份:
    2018
  • 资助金额:
    $ 44.8万
  • 项目类别:
    Continuing Grant
NSF-BSF: RI: Small: Collaborative Research: Modeling Crosslinguistic Influences Between Language Varieties
NSF-BSF:RI:小型:协作研究:模拟语言品种之间的跨语言影响
  • 批准号:
    1812327
  • 财政年份:
    2018
  • 资助金额:
    $ 44.8万
  • 项目类别:
    Continuing Grant
NSF-BSF: RI: Small: Collaborative Research: Modeling Crosslinguistic Influences Between Language Varieties
NSF-BSF:RI:小型:协作研究:模拟语言品种之间的跨语言影响
  • 批准号:
    1813153
  • 财政年份:
    2018
  • 资助金额:
    $ 44.8万
  • 项目类别:
    Continuing Grant
RI: Small: ConnotationNet: Modeling Non-Literal Meaning in Context
RI:小:ConnotationNet:在上下文中建模非字面意义
  • 批准号:
    1714566
  • 财政年份:
    2017
  • 资助金额:
    $ 44.8万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了