CRI: CRD A Richly Annotated Resource for Language Processing and Linguistics Research

CRI:CRD 语言处理和语言学研究的注释丰富的资源

基本信息

  • 批准号:
    0708952
  • 负责人:
  • 金额:
    $ 93.5万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Continuing Grant
  • 财政年份:
    2007
  • 资助国家:
    美国
  • 起止时间:
    2007-08-01 至 2014-12-31
  • 项目状态:
    已结题

项目摘要

This project is annotating a corpus of American English for a variety of linguistic features, including syntactic structures and semantic information. The semantic information includes frame information based on FrameNet together with sense information based on WordNet. The annotations in the corpus are manually assigned by human annotators to ensure their reliability. Bootstrapping methods, using portions of the hand validated annotations, are being used to improve the performance of automatic annotation tools. The corpus is drawn from the materials in the American National Corpus, which consists of written data and speech transcriptions generated y native speakers of American English and representing a broad range of genres. All of the annotations are represented in a common format to enable merging different annotation layers, so that interactions among different linguistic phenomena can be studied.The manually annotated corpus will provide an unparalleled resource for computational linguists and linguists who seek to identify patterns of syntactic and semantic usage that can feed the development of language models. This information can be used to train software to automatically annotate unseen data, which in turn enhances applications such as information retrieval and extraction and machine translation. Usage patterns for American English are also invaluable for the development of materials and tools to support English language learning. The resulting corpus and its annotations, together with tools for manipulating the data, will be made freely available for research purposes through the Linguistic Data Consortium.
本项目是对一个美国英语语料库进行注释,以获得各种语言特征,包括句法结构和语义信息。语义信息包括基于FrameNet的框架信息和基于WordNet的意义信息。 语料库中的注释由人工注释者手动分配,以确保其可靠性。引导方法,使用部分手工验证的注释,正在被用来提高自动注释工具的性能。该语料库是从美国国家语料库中提取的,由美国英语母语者的书面材料和语音翻译组成,代表了广泛的体裁。 所有的注释都以一种通用的格式表示,以便合并不同的注释层,从而可以研究不同语言现象之间的相互作用。人工注释的语料库将为计算语言学家和语言学家提供无与伦比的资源,他们寻求识别句法和语义使用模式,以促进语言模型的发展。这些信息可以用来训练软件自动注释看不见的数据,这反过来又增强了信息检索和提取以及机器翻译等应用。美国英语的使用模式对于开发支持英语学习的材料和工具也是非常宝贵的。由此产生的语料库及其注释,连同操纵数据的工具,将通过语言数据联合会免费提供,用于研究目的。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Nancy Ide其他文献

The Language Application Grid and Galaxy
语言应用网格和银河
A statistical measure of theme and structure
主题和结构的统计测量
Outline of a database model for electronic dictionaries
电子词典数据库模型概述
  • DOI:
    10.5555/3170967.3170995
  • 发表时间:
    1991
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Nancy Ide;J. Véronis;J. Maitre
  • 通讯作者:
    J. Maitre
Community Standards for Linguistically-Annotated Resources
语言注释资源的社区标准
  • DOI:
    10.1007/978-94-024-0881-2_4
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Nancy Ide;N. Calzolari;Judith Eckle;D. Gibbon;Sebastian Hellmann;Ki Yong Lee;Joakim Nivre;Laurent Romary
  • 通讯作者:
    Laurent Romary
Preface to the special issue: LREC 2012: state of the art in resource development and evaluation
  • DOI:
    10.1007/s10579-014-9289-9
  • 发表时间:
    2014-11-22
  • 期刊:
  • 影响因子:
    1.800
  • 作者:
    Nancy Ide;Nicoletta Calzolari
  • 通讯作者:
    Nicoletta Calzolari

Nancy Ide的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Nancy Ide', 18)}}的其他基金

EAGER: Collaborative Research: Mining Scientific Literature with the LAPPS Grid
EAGER:协作研究:使用 LAPPS 网格挖掘科学文献
  • 批准号:
    1811123
  • 财政年份:
    2018
  • 资助金额:
    $ 93.5万
  • 项目类别:
    Standard Grant
SI2-SSI: The Language Application Grid: A Framework for Rapid Adaptation and Reuse
SI2-SSI:语言应用网格:快速适应和重用的框架
  • 批准号:
    1147944
  • 财政年份:
    2012
  • 资助金额:
    $ 93.5万
  • 项目类别:
    Standard Grant
RUI: CRI: CI-ADDO-EN: Collaborative Research: MASC: A Community Resource For and By the People
RUI:CRI:CI-ADDO-EN:合作研究:MASC:人民的社区资源
  • 批准号:
    1059312
  • 财政年份:
    2011
  • 资助金额:
    $ 93.5万
  • 项目类别:
    Standard Grant
INTEROP: Sustainable Interoperability for Language Technology
INTEROP:语言技术的可持续互操作性
  • 批准号:
    0753069
  • 财政年份:
    2008
  • 资助金额:
    $ 93.5万
  • 项目类别:
    Continuing Grant
Collaborative Research: CRI: An Open Linguistic Infrastructure for American English
合作研究:CRI:美式英语的开放语言基础设施
  • 批准号:
    0551601
  • 财政年份:
    2006
  • 资助金额:
    $ 93.5万
  • 项目类别:
    Standard Grant
CRI: An Open Linguistic Infrastructure for American English
CRI:美式英语的开放语言基础设施
  • 批准号:
    0454130
  • 财政年份:
    2005
  • 资助金额:
    $ 93.5万
  • 项目类别:
    Standard Grant
ITR: American National Corpus: A Primary Resource for Linguistics Research
ITR:美国国家语料库:语言学研究的主要资源
  • 批准号:
    0218609
  • 财政年份:
    2002
  • 资助金额:
    $ 93.5万
  • 项目类别:
    Continuing Grant
XMELLT: Cross-lingual Multi-word Expression Lexicons for Language Technology
XMELLT:语言技术跨语言多词表达词典
  • 批准号:
    9982069
  • 财政年份:
    2000
  • 资助金额:
    $ 93.5万
  • 项目类别:
    Standard Grant
American National Corpus: Planning and Exploration Workshop
美国国家语料库:规划与探索研讨会
  • 批准号:
    9978422
  • 财政年份:
    1999
  • 资助金额:
    $ 93.5万
  • 项目类别:
    Standard Grant
Workshop: Exploring US-Romanian Collaboration in Language Technology
研讨会:探索美国-罗马尼亚在语言技术方面的合作
  • 批准号:
    9978601
  • 财政年份:
    1999
  • 资助金额:
    $ 93.5万
  • 项目类别:
    Standard Grant

相似国自然基金

A. muciniphila/吲哚介导的NPCs成体神经发生在CRD所致认知功能减 退中的机制研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
半乳凝素-3新型拮抗剂PK5-CRD的抗肝癌功能及机制研究
  • 批准号:
    81972242
  • 批准年份:
    2019
  • 资助金额:
    55.0 万元
  • 项目类别:
    面上项目
新型Smo CRD抑制剂的发现及抗髓母细胞瘤活性研究
  • 批准号:
    81803404
  • 批准年份:
    2018
  • 资助金额:
    21.5 万元
  • 项目类别:
    青年科学基金项目
CRD1调控水稻冠根发育的分子机理研究
  • 批准号:
    31600992
  • 批准年份:
    2016
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目
富含半胱氨酸区(CRD)在C族GPCRs激活过程中的作用机制研究
  • 批准号:
    30973514
  • 批准年份:
    2009
  • 资助金额:
    36.0 万元
  • 项目类别:
    面上项目
采用SDSL-EPR技术研究LSECtin-DC-SIGN凝集素家族CRD结构域的结构差异及其运动性与功能的关系
  • 批准号:
    30750009
  • 批准年份:
    2007
  • 资助金额:
    10.0 万元
  • 项目类别:
    专项基金项目

相似海外基金

Optimisation du tri et de la valorisation alternative pour les fines de CRD
CRD 罚款替代方案的优化
  • 批准号:
    571158-2021
  • 财政年份:
    2022
  • 资助金额:
    $ 93.5万
  • 项目类别:
    Applied Research and Development Grants - Level 2
Optimisation des propriétés du bois de CRD pour une utilisation dans un brûleur à combustible pulvérisé
优化 CRD 资源在燃烧和可燃粉末中的利用
  • 批准号:
    561072-2020
  • 财政年份:
    2021
  • 资助金额:
    $ 93.5万
  • 项目类别:
    Applied Research and Development Grants - Level 1
Amélioration du tri des résidus de fin de ligne de CRD par spectrométrie proche infra-rouge
红光光谱中 CRD 末端残留物的改善
  • 批准号:
    561750-2021
  • 财政年份:
    2021
  • 资助金额:
    $ 93.5万
  • 项目类别:
    Applied Research and Development Grants - Level 1
Contrôle du formaldéhyde émis par la combustion du bois de CRD post-conditionnement
CRD 后处理过程中甲醛燃烧的控制
  • 批准号:
    560398-2020
  • 财政年份:
    2020
  • 资助金额:
    $ 93.5万
  • 项目类别:
    Applied Research and Development Grants - Level 1
Développement d'un procédé pour le contrôle de la qualité du bois de CRD et des émissions atmosphériques
CRD 和大气排放质量控制的发展
  • 批准号:
    519847-2017
  • 财政年份:
    2020
  • 资助金额:
    $ 93.5万
  • 项目类别:
    Applied Research and Development Grants - Level 2
Expérimentation de la micronisation pour la valorisation énergétique des bois de CRD (construction, rénovation et démolition)
Experimentation de la micronification pour la valorise énergétique des bois de CRD(建筑、翻新和拆除)
  • 批准号:
    553265-2020
  • 财政年份:
    2020
  • 资助金额:
    $ 93.5万
  • 项目类别:
    Applied Research and Development Grants - Level 1
Développement d'un procédé pour le contrôle de la qualité du bois de CRD et des émissions atmosphériques
CRD 和大气排放质量控制的发展
  • 批准号:
    519847-2017
  • 财政年份:
    2019
  • 资助金额:
    $ 93.5万
  • 项目类别:
    Applied Research and Development Grants - Level 2
Valorisation des résidus de criblage primaire de CRD
CRD 初级抄写残渣的价值
  • 批准号:
    535794-2019
  • 财政年份:
    2019
  • 资助金额:
    $ 93.5万
  • 项目类别:
    Applied Research and Development Grants - Level 1
Potentiel de valorisation énergétique de résidus de bois non classifiés du secteur CRD
CRD 部门非分类剩余物的潜力
  • 批准号:
    523725-2018
  • 财政年份:
    2018
  • 资助金额:
    $ 93.5万
  • 项目类别:
    Applied Research and Development Grants - Level 1
Développement d'un procédé pour le contrôle de la qualité du bois de CRD et des émissions**atmosphériques
CRD 和排放**大气质量控制的发展
  • 批准号:
    519847-2017
  • 财政年份:
    2018
  • 资助金额:
    $ 93.5万
  • 项目类别:
    Applied Research and Development Grants - Level 2
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了