EAGER: PARTIAL: An Exploratory Study on Practical Approaches for Robust NLP Tools with Integrated Annotation Languages

EAGER: PARTIAL:关于具有集成注释语言的鲁棒 NLP 工具实用方法的探索性研究

基本信息

  • 批准号:
    1352440
  • 负责人:
  • 金额:
    $ 10万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2013
  • 资助国家:
    美国
  • 起止时间:
    2013-09-01 至 2014-08-31
  • 项目状态:
    已结题

项目摘要

In order to develop natural language processing (NLP) technologies for text in a wider range of languages, dialects, genres, and styles, this Early Grant for Exploratory Research investigates a novel methodological approach. Conventionally, linguistic experts are employed to create gold-standard linguistically annotated datasets to which supervised machine learning algorithms are applied. This project frees annotators from the requirement that annotations be complete by moving more of the burden to learning algorithms. Algorithms are developed that are robust to partial evidence, annotator variation, and noise due to errors. As a result, any language enthusiast (not just trained experts) can provide annotations so that NLP can be developed for more kinds of text in more languages for less money. In this exploration, the focus is on dependency parsing, a fundamental NLP component that predicts the grammatical relationships between words in sentences, with experimentation on data in English (two genres), Chinese, and Farsi. The formal basis for the approach is a framework called Graph Fragment Language (GFL). The project assesses the quality of parsers learned from GFL and the productivity of annotators accorded this new flexibility.Beyond documentation and assessment of the new methodology, this project produces open-source software tools for gathering annotated data and constructing NLP tools using the data. It emphasizes the usability of these tools in classrooms, contributing exercises that can be used in NLP and linguistics courses to allow students to engage directly with data, with the models that make use of the data, and with the technological goals that data annotation supports.
为了开发自然语言处理(NLP)技术,用于更广泛的语言,方言,体裁和风格的文本,这项探索性研究的早期资助研究了一种新的方法。 传统上,语言专家被用来创建黄金标准的语言注释数据集,监督机器学习算法被应用于这些数据集。 这个项目通过将更多的负担转移到学习算法上,将注释者从注释必须完整的要求中解放出来。算法的发展是强大的部分证据,注释器的变化,和噪声由于错误。 因此,任何语言爱好者(不仅仅是受过训练的专家)都可以提供注释,这样就可以用更少的钱为更多语言的更多类型的文本开发NLP。 在这次探索中,重点是依赖分析,这是一个基本的NLP组件,可以预测句子中单词之间的语法关系,并对英语(两种类型),中文和波斯语的数据进行实验。 该方法的正式基础是一个称为图形片段语言(GFL)的框架。 该项目评估了从GFL学习的解析器的质量和注释器的生产力,并赋予了这种新的灵活性。除了对新方法的文档和评估之外,该项目还制作了开源软件工具,用于收集注释数据并使用数据构建NLP工具。 它强调了这些工具在课堂上的可用性,提供了可以在NLP和语言学课程中使用的练习,让学生直接参与数据,使用数据的模型,以及数据注释支持的技术目标。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Noah Smith其他文献

Buying health: assessing the impact of a consumer-side vegetable subsidy on purchasing, consumption and waste
购买健康:评估消费者侧蔬菜补贴对购买、消费和浪费的影响
  • DOI:
  • 发表时间:
    2015
  • 期刊:
  • 影响因子:
    3.2
  • 作者:
    Noah Smith
  • 通讯作者:
    Noah Smith
Implications for cumulative and prolonged clinical improvement induced by cross-linked hyaluronic acid: An in vivo biochemical/microscopic study in humans.
交联透明质酸诱导的累积和长期临床改善的影响:人类体内生化/显微镜研究。
  • DOI:
    10.1111/exd.14998
  • 发表时间:
    2024
  • 期刊:
  • 影响因子:
    3.6
  • 作者:
    Frank Wang;T. Do;Noah Smith;J. Orringer;Sewon Kang;John J Voorhees;Gary J. Fisher
  • 通讯作者:
    Gary J. Fisher
THE NORTH ATLANTIC TREATY ORGANIZATION AND UNITED STATES RELATIONSHIP: A STUDY OF ITS DEVELOPMENT AND POSSIBLE FUTURE
北大西洋公约组织与美国的关系:对其发展和可能的未来的研究
  • DOI:
  • 发表时间:
    2015
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Noah Smith
  • 通讯作者:
    Noah Smith
Constructions of locally recoverable codes with large availability
  • DOI:
    10.1007/s10623-025-01624-w
  • 发表时间:
    2025-04-05
  • 期刊:
  • 影响因子:
    1.200
  • 作者:
    Giacomo Micheli;Vincenzo Pallozzi Lavorante;Abhi Shukul;Noah Smith
  • 通讯作者:
    Noah Smith
Biopsy of Suspected Melanoma
疑似黑色素瘤活检
  • DOI:
    10.1007/978-3-319-46029-1_10-1
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Noah Smith;T. Johnson;J. Kelly;A. Sober;C. Bichakjian
  • 通讯作者:
    C. Bichakjian

Noah Smith的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Noah Smith', 18)}}的其他基金

NSF-BSF: RI: Small: Efficient Transformers via Formal and Empirical Analysis
NSF-BSF:RI:小型:通过形式和经验分析的高效变压器
  • 批准号:
    2113530
  • 财政年份:
    2021
  • 资助金额:
    $ 10万
  • 项目类别:
    Standard Grant
RI/SES: Conference Proposal: Doctoral Consortium on Text as Data
RI/SES:会议提案:文本即数据博士联盟
  • 批准号:
    1830158
  • 财政年份:
    2018
  • 资助金额:
    $ 10万
  • 项目类别:
    Standard Grant
NSF-BSF: RI: Small: Collaborative Research: Modeling Crosslinguistic Influences Between Language Varieties
NSF-BSF:RI:小型:协作研究:模拟语言品种之间的跨语言影响
  • 批准号:
    1813153
  • 财政年份:
    2018
  • 资助金额:
    $ 10万
  • 项目类别:
    Continuing Grant
RI: Medium: Broad-Coverage Semantic Parsing: Linguistic Representation Learning from Crowd-Scale Data
RI:中:广泛覆盖的语义解析:从人群规模数据中学习语言表示
  • 批准号:
    1562364
  • 财政年份:
    2016
  • 资助金额:
    $ 10万
  • 项目类别:
    Continuing Grant
Workshop: Support for a workshop on scientific research applications of natural language technologies
研讨会:支持自然语言技术科研应用研讨会
  • 批准号:
    1433108
  • 财政年份:
    2014
  • 资助金额:
    $ 10万
  • 项目类别:
    Standard Grant
BIGDATA: Small: DA: Big Multilinguality for Data-Driven Lexical Semantics
BIGDATA:小:DA:数据驱动词汇语义的大多语言性
  • 批准号:
    1251131
  • 财政年份:
    2013
  • 资助金额:
    $ 10万
  • 项目类别:
    Standard Grant
SoCS: Collaborative Research: Data-Driven, Computational Models for Discovery and Analysis of Framing
SoCS:协作研究:用于发现和分析框架的数据驱动计算模型
  • 批准号:
    1211277
  • 财政年份:
    2012
  • 资助金额:
    $ 10万
  • 项目类别:
    Standard Grant
CAREER: Flexible Learning for Natural Language Processing
职业:自然语言处理的灵活学习
  • 批准号:
    1054319
  • 财政年份:
    2011
  • 资助金额:
    $ 10万
  • 项目类别:
    Continuing Grant
RI-Small: Probabilistic Models for Structure Discovery in Text
RI-Small:文本结构发现的概率模型
  • 批准号:
    0915187
  • 财政年份:
    2009
  • 资助金额:
    $ 10万
  • 项目类别:
    Continuing Grant
SGER: Scaling up unsupervised grammar induction
SGER:扩大无监督语法归纳
  • 批准号:
    0836431
  • 财政年份:
    2008
  • 资助金额:
    $ 10万
  • 项目类别:
    Standard Grant

相似国自然基金

Graphon mean field games with partial observation and application to failure detection in distributed systems
  • 批准号:
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
Partial EIV 模型参数估计理论及其在测量数据处理中的应用研究
  • 批准号:
    41664001
  • 批准年份:
    2016
  • 资助金额:
    40.0 万元
  • 项目类别:
    地区科学基金项目
Partial Spread Bent函数与Bent-Negabent函数的构造及密码学性质研究
  • 批准号:
    61402377
  • 批准年份:
    2014
  • 资助金额:
    25.0 万元
  • 项目类别:
    青年科学基金项目
图的l1-嵌入性以及partial立方图和多重median图的刻画
  • 批准号:
    11261019
  • 批准年份:
    2012
  • 资助金额:
    45.0 万元
  • 项目类别:
    地区科学基金项目

相似海外基金

Partial Support of the Condensed Matter and Materials Research Committee
凝聚态与材料研究委员会的部分支持
  • 批准号:
    2337353
  • 财政年份:
    2024
  • 资助金额:
    $ 10万
  • 项目类别:
    Standard Grant
Conference: Geometric Measure Theory, Harmonic Analysis, and Partial Differential Equations: Recent Advances
会议:几何测度理论、调和分析和偏微分方程:最新进展
  • 批准号:
    2402028
  • 财政年份:
    2024
  • 资助金额:
    $ 10万
  • 项目类别:
    Standard Grant
Collaborative Research: Data-Driven Elastic Shape Analysis with Topological Inconsistencies and Partial Matching Constraints
协作研究:具有拓扑不一致和部分匹配约束的数据驱动的弹性形状分析
  • 批准号:
    2402555
  • 财政年份:
    2024
  • 资助金额:
    $ 10万
  • 项目类别:
    Standard Grant
Problems in Regularity Theory of Partial Differential Equations
偏微分方程正则论中的问题
  • 批准号:
    2350129
  • 财政年份:
    2024
  • 资助金额:
    $ 10万
  • 项目类别:
    Standard Grant
Conference: Recent advances in nonlinear Partial Differential Equations
会议:非线性偏微分方程的最新进展
  • 批准号:
    2346780
  • 财政年份:
    2024
  • 资助金额:
    $ 10万
  • 项目类别:
    Standard Grant
Partial differential equation: Schrodinger operator and long-time dynamics
偏微分方程:薛定谔算子和长期动力学
  • 批准号:
    FT230100588
  • 财政年份:
    2024
  • 资助金额:
    $ 10万
  • 项目类别:
    ARC Future Fellowships
CAREER: Real-time control of elementary catalytic steps: Controlling total vs partial electrocatalytic oxidation of alkanes and olefins
职业:实时控制基本催化步骤:控制烷烃和烯烃的全部与部分电催化氧化
  • 批准号:
    2338627
  • 财政年份:
    2024
  • 资助金额:
    $ 10万
  • 项目类别:
    Continuing Grant
Geometric Techniques for Studying Singular Solutions to Hyperbolic Partial Differential Equations in Physics
研究物理学中双曲偏微分方程奇异解的几何技术
  • 批准号:
    2349575
  • 财政年份:
    2024
  • 资助金额:
    $ 10万
  • 项目类别:
    Standard Grant
Regularity Problems in Free Boundaries and Degenerate Elliptic Partial Differential Equations
自由边界和简并椭圆偏微分方程中的正则问题
  • 批准号:
    2349794
  • 财政年份:
    2024
  • 资助金额:
    $ 10万
  • 项目类别:
    Standard Grant
Interfaces, Degenerate Partial Differential Equations, and Convexity
接口、简并偏微分方程和凸性
  • 批准号:
    2348846
  • 财政年份:
    2024
  • 资助金额:
    $ 10万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了