RI: Small: Linguistic Semantics and Discourse from Leaky Distant Supervision

RI:小:来自泄漏远程监督的语言语义和话语

基本信息

  • 批准号:
    1618193
  • 负责人:
  • 金额:
    $ 40.68万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Continuing Grant
  • 财政年份:
    2016
  • 资助国家:
    美国
  • 起止时间:
    2016-08-01 至 2020-07-31
  • 项目状态:
    已结题

项目摘要

This project studies novel algorithms for building artificial intelligence (AI) systems that can learn to improve their performance with a human in the loop. Many recent AI successes are driven by large, expensive and difficult-to-collect datasets. This yields systems that are deep, but narrow. The goal of this project is to build technology that will allow AI systems to learn from their interactions with people. The project focuses on key applications related to natural language understanding: building technology to understand the meanings of individual sentences, and integrate those meanings into the meaning of a discourse or dialog. One specific application pursued herein relates to extracting biomedical knowledge from text, which will pave the way to helping biomedical researchers develop novel hypotheses. The work will fund students from underrepresented groups in STEM, and encourage cross-disciplinary education at the graduate and undergraduate levels. Finally, the work will be communicated to the public not just with scientific papers, but internationally through social media and locally through visits to middle schools and high schools.Natural language processing (and other fields of artificial intelligence) have had enormous success by training supervised learning systems on large labeled datasets ("corpora"). Unfortunately, curating such corpora is infeasible except for very specific problems. This happens either because it is too expensive, or it is too difficult to get human labelers to agree on an annotation standard. Instead of relying solely on human labeled data, this project develops algorithms that can learn from human interaction. These systems can continually improve their performance based on downstream performance supervision, often with a human in the loop. This work leverages recent developments on the structured contextual bandits learning framework which provides a theoretically grounded and computationally efficient way in which to develop novel approaches to distant supervision. This resulting learning techniques will push advances in natural language understanding: semantic parsing and discourse interpretation. Furthermore, the underlying imitation learning technology is broadly applicable, including novel applications to recurrent neural network models. To aid adoption by the research community, code and data from this project will be released open source.
该项目研究了建立人工智能(AI)系统的新型算法,这些算法可以学会在循环中与人类的性能提高其性能。许多最近的AI成功都由大型,昂贵且难以收集的数据集驱动。这产生了深层但狭窄的系统。该项目的目的是建立技术,使AI系统可以从与人的互动中学习。该项目着重于与自然语言理解有关的关键应用:建立技术以了解单个句子的含义,并将这些含义纳入话语或对话的含义。 本文提出的一种特定应用与从文本中提取生物医学知识有关,这将为生物医学研究人员发展新的假设铺平道路。 这项工作将为STEM中代表性不足的团体的学生提供资金,并鼓励研究生和本科生的跨学科教育。最后,这项工作将不仅与科学论文交流,而且通过社交媒体在国际上传达,并通过访问中学和高中的访问。自然语言处理(以及其他人工智能领域)通过在大型标签数据集(“ Corpora”)上培训监督的学习系统,从而取得了巨大的成功。 不幸的是,除了非常具体的问题外,策划此类语料库是不可行的。发生这种情况是因为它太昂贵了,或者很难让人类标签者就注释标准达成共识。 该项目不仅依靠人类标记的数据,而是开发了可以从人类相互作用中学习的算法。 这些系统通常会根据下游的性能监督不断提高其性能,通常是在循环中的人。这项工作利用了结构化上下文匪徒学习框架的最新发展,该框架提供了一种理论上扎根且在计算上有效的方法,以开发新颖的方法来进行远距离监督。这项由此产生的学习技术将推动自然语言理解的进步:语义解析和话语解释。此外,基本的模仿学习技术广泛适用,包括对复发性神经网络模型的新应用。 为了帮助研究社区采用,该项目的代码和数据将被发布开源。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Hal Daume其他文献

Seamful XAI: Operationalizing Seamful Design in Explainable AI
Seamful XAI:在可解释的 AI 中实施 Seamful 设计

Hal Daume的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Hal Daume', 18)}}的其他基金

Institute for Trustworthy AI in Law and Society (TRAILS)
法律与社会可信人工智能研究所 (TRAILS)
  • 批准号:
    2229885
  • 财政年份:
    2023
  • 资助金额:
    $ 40.68万
  • 项目类别:
    Cooperative Agreement
RI: EAGER: Collaborative Research: Adaptive Heads-up Displays for Simultaneous Interpretation
RI:EAGER:协作研究:用于同声传译的自适应平视显示器
  • 批准号:
    1748663
  • 财政年份:
    2017
  • 资助金额:
    $ 40.68万
  • 项目类别:
    Standard Grant
EAGER: Discrete Algorithms in NLP
EAGER:NLP 中的离散算法
  • 批准号:
    1451430
  • 财政年份:
    2014
  • 资助金额:
    $ 40.68万
  • 项目类别:
    Standard Grant
RI: SMALL: Statistical Linguistic Typology
RI:小:统计语言类型学
  • 批准号:
    1153487
  • 财政年份:
    2011
  • 资助金额:
    $ 40.68万
  • 项目类别:
    Continuing Grant
ICML 2011 Proposal for Student Poster Program and Travel Scholarships
ICML 2011 年学生海报计划和旅行奖学金提案
  • 批准号:
    1130109
  • 财政年份:
    2011
  • 资助金额:
    $ 40.68万
  • 项目类别:
    Standard Grant
Collaborative Research: EAGER: Computational Thinking Olympiad
合作研究:EAGER:计算思维奥林匹克竞赛
  • 批准号:
    1048401
  • 财政年份:
    2010
  • 资助金额:
    $ 40.68万
  • 项目类别:
    Standard Grant
RI: SMALL: Statistical Linguistic Typology
RI:小:统计语言类型学
  • 批准号:
    0916372
  • 财政年份:
    2009
  • 资助金额:
    $ 40.68万
  • 项目类别:
    Continuing Grant
Computational Thinking Olympiad: Brainstorming Workshop
计算思维奥林匹克:头脑风暴研讨会
  • 批准号:
    0848473
  • 财政年份:
    2008
  • 资助金额:
    $ 40.68万
  • 项目类别:
    Standard Grant
Cross-Task Learning for Natural Language Processing
自然语言处理的跨任务学习
  • 批准号:
    0712764
  • 财政年份:
    2007
  • 资助金额:
    $ 40.68万
  • 项目类别:
    Continuing Grant

相似国自然基金

靶向Treg-FOXP3小分子抑制剂的筛选及其在肺癌免疫治疗中的作用和机制研究
  • 批准号:
    32370966
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
化学小分子激活YAP诱导染色质可塑性促进心脏祖细胞重编程的表观遗传机制研究
  • 批准号:
    82304478
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
靶向小胶质细胞的仿生甘草酸纳米颗粒构建及作用机制研究:脓毒症相关性脑病的治疗新策略
  • 批准号:
    82302422
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
HMGB1/TLR4/Cathepsin B途径介导的小胶质细胞焦亡在新生大鼠缺氧缺血脑病中的作用与机制
  • 批准号:
    82371712
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目
小分子无半胱氨酸蛋白调控生防真菌杀虫活性的作用与机理
  • 批准号:
    32372613
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目

相似海外基金

RI: Small: Linguistic Structure in Neural Sequence Models
RI:小:神经序列模型中的语言结构
  • 批准号:
    1718846
  • 财政年份:
    2017
  • 资助金额:
    $ 40.68万
  • 项目类别:
    Standard Grant
RI: Small: Modeling Lexical Borrowing to Bridge the "Linguistic Divide" in Natural Language Processing
RI:小:建模词汇借用以弥合自然语言处理中的“语言鸿沟”
  • 批准号:
    1526745
  • 财政年份:
    2015
  • 资助金额:
    $ 40.68万
  • 项目类别:
    Standard Grant
RI: SMALL: Statistical Linguistic Typology
RI:小:统计语言类型学
  • 批准号:
    1153487
  • 财政年份:
    2011
  • 资助金额:
    $ 40.68万
  • 项目类别:
    Continuing Grant
RI: Small: Interpreting Linguistic Spatiotemporal Relations in Static and Dynamic Contexts
RI:小:解释静态和动态上下文中的语言时空关系
  • 批准号:
    1017765
  • 财政年份:
    2010
  • 资助金额:
    $ 40.68万
  • 项目类别:
    Standard Grant
RI: SMALL: Statistical Linguistic Typology
RI:小:统计语言类型学
  • 批准号:
    0916372
  • 财政年份:
    2009
  • 资助金额:
    $ 40.68万
  • 项目类别:
    Continuing Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了