RI: Small: Collaborative Research: Research Leading to Comprehensive Guidelines for Discourse Relation Annotation

RI:小型:协作研究:研究导致话语关系注释的综合指南

基本信息

  • 批准号:
    1422186
  • 负责人:
  • 金额:
    $ 20万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Continuing Grant
  • 财政年份:
    2014
  • 资助国家:
    美国
  • 起止时间:
    2014-09-01 至 2018-08-31
  • 项目状态:
    已结题

项目摘要

Machine Translation, automated question answering, dialogue systems -- the many useful, emerging language technologies -- depend on recognizing patterns in text. Right now, the only patterns that can dependably be recognized are very local, no bigger than a sentence clause. Enabling patterns to be recognized across clauses in a text by identifying what links them and what the link conveys was the goal of the NSF-supported Penn Discourse TreeBank (PDTB), a nearly 1-million word text resource labelled with text-linking devices ("discourse connectives" and adjacency), the spans of text they link, and what the link conveys. In the five years since the release of the PDTB, computational linguistics researchers from around the world have used the format it pioneered,to develop similar resources for other languages and to use these resources for recognizing larger patterns in text. The current PDTB, however, lacks the full range of explicit and implicit text-linking devices in English and what they convey; the information which is badly needed by many forward-looking language technology applications. The goal of this project is to conduct research with the purpose to enrich the PDTB with these additional devices and to develop ways for authoritatively annotating other texts with similar information, but with less manual effort, as a basis for extending the range of texts whose larger, cross-clausal patterns can be recognized automatically.This project is a response to calls (from both the language technology and computational psycholinguistics communities) for increased coverage and continuity of discourse relation annotation, both across and within the sentences of a text. To ensure a systematic annotation scheme grounded in evidence, the project starts by addressing some foundational questions about the properties of additional linguistic signals of discourse relations and how to capture these properties consistently and completely through manual annotation. From this follows systematic, evidence-grounded annotation of Entity Relations; constructions (other than discourse connectives) that reliably signal discourse relations; implicit intra-sentential discourse relations (building on PropBank annotation of the Penn TreeBank, and concurrent discourse relations (where implicit relations hold in addition to ones signaled explicitly). The project also explores the use of crowd-sourcing to support sub-tasks in discourse relation annotation that would lead to a reduction in the manual effort needed for expert annotation of other corpora, or enable large-scale experiments on aspects of human understanding of discourse relations. As with the Penn Discourse TreeBank 2.0, the enhanced corpus resulting from the project will be disseminated by the Linguistic Data Consortium (LDC), a well-established institution for world-wide distribution of language resources.
机器翻译、自动问答、对话系统--许多有用的新兴语言技术--都依赖于识别文本中的模式。现在,唯一能被识别的模式是非常局部的,不超过一个句子从句。通过识别什么链接它们以及链接传达的内容来识别文本中跨子句的模式是NSF支持的Penn Discourse TreeBank(PDTB)的目标,这是一个近100万字的文本资源,标有文本链接设备(“话语连接词”和邻接),它们链接的文本跨度以及链接传达的内容。在PDTB发布后的五年里,来自世界各地的计算语言学研究人员使用它开创的格式为其他语言开发了类似的资源,并使用这些资源识别文本中的较大模式。然而,目前的PDTB缺乏英语中所有的显式和隐式文本链接设备及其所传达的信息;许多前瞻性语言技术应用程序迫切需要的信息。该项目的目标是进行研究,目的是用这些额外的设备来丰富PDTB,并开发出作者注释具有类似信息的其他文本的方法,但人工工作量较少,作为扩展文本范围的基础,跨从句模式可以被自动识别。这个项目是对呼叫的响应(来自语言技术和计算心理语言学社区)用于增加跨文本的句子和在文本的句子内的话语关系注释的覆盖范围和连续性。为了确保系统的注释方案以证据为基础,该项目首先解决一些基本问题,这些问题涉及话语关系的附加语言信号的属性,以及如何通过手动注释一致和完整地捕获这些属性。从这一点可以得出系统的、基于证据的实体关系注释;可靠地表示话语关系的结构(而不是话语连接词);隐含的内部话语关系(建立在Penn TreeBank的PropBank注释上),以及并发的话语关系(除了明确表示的关系之外,隐含的关系也成立)。该项目还探讨了使用众包来支持话语关系注释中的子任务,这将导致减少专家注释其他语料库所需的人工工作,或使人类理解话语关系方面的大规模实验成为可能。与宾夕法尼亚大学话语树库2.0一样,该项目产生的增强语料库将由语言数据联合会(LDC)传播,这是一个在世界范围内分发语言资源的成熟机构。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Zachary Ives其他文献

Zachary Ives的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Zachary Ives', 18)}}的其他基金

III: Small: Promoting Reuse and Retargeting in Data Science
III:小:促进数据科学中的重用和重定向
  • 批准号:
    1910108
  • 财政年份:
    2019
  • 资助金额:
    $ 20万
  • 项目类别:
    Standard Grant
CICI: Data Provenance: Provenance-Based Trust Management for Collaborative Data Curation
CICI:数据来源:基于来源的协作数据管理信任管理
  • 批准号:
    1547360
  • 财政年份:
    2015
  • 资助金额:
    $ 20万
  • 项目类别:
    Standard Grant
III: EAGER: Data Integration as a Dialogue with the User
III:EAGER:数据集成作为与用户的对话
  • 批准号:
    1050448
  • 财政年份:
    2010
  • 资助金额:
    $ 20万
  • 项目类别:
    Standard Grant
NeTS/NOSS: ASPEN: Abstraction-based Sensor Programming Environment
NeTS/NOSS:ASPEN:基于抽象的传感器编程环境
  • 批准号:
    0721541
  • 财政年份:
    2007
  • 资助金额:
    $ 20万
  • 项目类别:
    Continuing Grant
III: Distributed Stream Integration
III:分布式流集成
  • 批准号:
    0713267
  • 财政年份:
    2007
  • 资助金额:
    $ 20万
  • 项目类别:
    Continuing Grant
CAREER: Orchestra - Managing the Collaborative Sharing of Evolving Data
职业:管弦乐队 - 管理不断变化的数据的协作共享
  • 批准号:
    0447972
  • 财政年份:
    2005
  • 资助金额:
    $ 20万
  • 项目类别:
    Continuing Grant

相似国自然基金

昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
  • 批准号:
    n/a
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
  • 批准号:
    32000033
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
  • 批准号:
    31972324
  • 批准年份:
    2019
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
  • 批准号:
    81900988
  • 批准年份:
    2019
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
  • 批准号:
    31802058
  • 批准年份:
    2018
  • 资助金额:
    26.0 万元
  • 项目类别:
    青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
  • 批准号:
    31870821
  • 批准年份:
    2018
  • 资助金额:
    56.0 万元
  • 项目类别:
    面上项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
  • 批准号:
    31772128
  • 批准年份:
    2017
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
  • 批准号:
    81704176
  • 批准年份:
    2017
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
  • 批准号:
    91640114
  • 批准年份:
    2016
  • 资助金额:
    85.0 万元
  • 项目类别:
    重大研究计划

相似海外基金

Collaborative Research: RI: Small: Foundations of Few-Round Active Learning
协作研究:RI:小型:少轮主动学习的基础
  • 批准号:
    2313131
  • 财政年份:
    2023
  • 资助金额:
    $ 20万
  • 项目类别:
    Standard Grant
Collaborative Research: RI: Small: Motion Fields Understanding for Enhanced Long-Range Imaging
合作研究:RI:小型:增强远程成像的运动场理解
  • 批准号:
    2232298
  • 财政年份:
    2023
  • 资助金额:
    $ 20万
  • 项目类别:
    Standard Grant
Collaborative Research: RI: Small: Deep Constrained Learning for Power Systems
合作研究:RI:小型:电力系统的深度约束学习
  • 批准号:
    2345528
  • 财政年份:
    2023
  • 资助金额:
    $ 20万
  • 项目类别:
    Standard Grant
Collaborative Research: RI: Small: End-to-end Learning of Fair and Explainable Schedules for Court Systems
合作研究:RI:小型:法院系统公平且可解释的时间表的端到端学习
  • 批准号:
    2232055
  • 财政年份:
    2023
  • 资助金额:
    $ 20万
  • 项目类别:
    Standard Grant
Collaborative Research: RI: Small: End-to-end Learning of Fair and Explainable Schedules for Court Systems
合作研究:RI:小型:法院系统公平且可解释的时间表的端到端学习
  • 批准号:
    2232054
  • 财政年份:
    2023
  • 资助金额:
    $ 20万
  • 项目类别:
    Standard Grant
Collaborative Research: RI: Small: Motion Fields Understanding for Enhanced Long-Range Imaging
合作研究:RI:小型:增强远程成像的运动场理解
  • 批准号:
    2232300
  • 财政年份:
    2023
  • 资助金额:
    $ 20万
  • 项目类别:
    Standard Grant
Collaborative Research: RI: Small: Motion Fields Understanding for Enhanced Long-Range Imaging
合作研究:RI:小型:增强远程成像的运动场理解
  • 批准号:
    2232299
  • 财政年份:
    2023
  • 资助金额:
    $ 20万
  • 项目类别:
    Standard Grant
Collaborative Research: RI: Small: Foundations of Few-Round Active Learning
协作研究:RI:小型:少轮主动学习的基础
  • 批准号:
    2313130
  • 财政年份:
    2023
  • 资助金额:
    $ 20万
  • 项目类别:
    Standard Grant
RI: Small: Collaborative Research: Evolutionary Approach to Optimal Morphology and Control of Transformable Soft Robots
RI:小型:协作研究:可变形软机器人的最佳形态和控制的进化方法
  • 批准号:
    2325491
  • 财政年份:
    2023
  • 资助金额:
    $ 20万
  • 项目类别:
    Standard Grant
Collaborative Research: RI: Small: End-to-end Learning of Fair and Explainable Schedules for Court Systems
合作研究:RI:小型:法院系统公平且可解释的时间表的端到端学习
  • 批准号:
    2334936
  • 财政年份:
    2023
  • 资助金额:
    $ 20万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了