CAREER: Robust Parsing for New Domains and Languages

职业:新领域和语言的稳健解析

基本信息

  • 批准号:
    0745914
  • 负责人:
  • 金额:
    $ 50万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Continuing Grant
  • 财政年份:
    2008
  • 资助国家:
    美国
  • 起止时间:
    2008-07-01 至 2014-06-30
  • 项目状态:
    已结题

项目摘要

To facilitate linguistic communications, natural language processing (NLP) technologies must be applicable to different languages across different domains. A limitation of many NLP systems is that they do not perform as well on data types that diverge from their training examples. The objective of this CAREER project is to increase the robustness and coverage of a fundamental NLP component, the syntactic parser.Specifically, this project explores adaptation methods to extend a standard English parser for processing different domains (e.g., scientific literature, emails) and different languages (e.g., Chinese). Three types of correspondences are considered. First, if coarse-level correspondences are explicit in the data (e.g., bilingual documents), finer-grained correspondences at the word- or phrasal-level may be inferred, and semi-supervised learning may be used to transfer domain knowledge across the inferred correspondence.Second, if the correspondences are inexact (e.g., multiple translations of varying quality), the mis-matched portions may be identified and transformed to achieve a closer mapping. Third, if the correspondences are indirect, methods for inducing correspondences from non-parallel corpora may be appropriate.Parser adaptation stands to increase the range of NLP applications; examples include: data mining from medical documents and automatic tutoring for non-English speakers. As the project aims to bring together several strands of research, it offers ample research opportunities to graduate and undergraduate students. The algorithmic aspects encourage forming synthesis from areas of semi-supervised learning, relational data modeling, grammar induction, and machine translation; the empirical aspects afford students an arena to hone their skills in good scientific methodologies.
为了促进语言交流,自然语言处理(NLP)技术必须适用于不同领域的不同语言。许多NLP系统的一个限制是,它们不能很好地处理与其训练样本不同的数据类型。这个职业项目的目标是增加基本的自然语言处理组件-句法分析器的健壮性和覆盖率。具体地说,该项目探索了适配方法来扩展标准英语分析器,以处理不同的领域(例如,科学文献、电子邮件)和不同的语言(例如,中文)。我们考虑了三种类型的对应。首先,如果粗略对应关系在数据中是显式的(例如,双语文档),则可以推断在单词或短语级别的细粒度对应关系,并且可以使用半监督学习来跨所推断的对应关系传递领域知识。第三,如果对应是间接的,从非平行语料库中归纳对应的方法可能是合适的。句法器适配将扩大自然语言处理的应用范围;例如:从医学文档中进行数据挖掘和为非英语使用者提供自动辅导。由于该项目旨在将几个研究方向结合在一起,它为研究生和本科生提供了充足的研究机会。算法方面鼓励从半监督学习、关系数据建模、语法归纳和机器翻译等领域形成综合;经验方面为学生提供了一个磨练良好科学方法技能的舞台。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Rebecca Hwa其他文献

Topological considerations in the generation of scroll waves in excitable and cyclical media
在可兴奋和循环介质中产生滚动波的拓扑考虑
  • DOI:
    10.1016/0167-2789(94)90300-x
  • 发表时间:
    1994
  • 期刊:
  • 影响因子:
    0
  • 作者:
    N. Otani;Rebecca Hwa
  • 通讯作者:
    Rebecca Hwa

Rebecca Hwa的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Rebecca Hwa', 18)}}的其他基金

IPA Action
IPA 行动
  • 批准号:
    1935188
  • 财政年份:
    2019
  • 资助金额:
    $ 50万
  • 项目类别:
    Intergovernmental Personnel Award
EAGER: Computational Models of Essay Rewritings
EAGER:论文重写的计算模型
  • 批准号:
    1550635
  • 财政年份:
    2015
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
Collaborative: Discriminative Knowledge-Rich Language Modeling for Machine Translation
协作:用于机器翻译的判别性知识丰富的语言建模
  • 批准号:
    0712810
  • 财政年份:
    2007
  • 资助金额:
    $ 50万
  • 项目类别:
    Continuing Grant
Student Research Workshop in Computational Linguistics, at the COLING-ACL 2006 Conference
计算语言学学生研究研讨会,COLING-ACL 2006 会议
  • 批准号:
    0612690
  • 财政年份:
    2006
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
SGER: Learning Syntax-based Evaluation Metrics for Machine Translation
SGER:学习基于语法的机器翻译评估指标
  • 批准号:
    0612791
  • 财政年份:
    2006
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant

相似国自然基金

供应链管理中的稳健型(Robust)策略分析和稳健型优化(Robust Optimization )方法研究
  • 批准号:
    70601028
  • 批准年份:
    2006
  • 资助金额:
    7.0 万元
  • 项目类别:
    青年科学基金项目
心理紧张和应力影响下Robust语音识别方法研究
  • 批准号:
    60085001
  • 批准年份:
    2000
  • 资助金额:
    14.0 万元
  • 项目类别:
    专项基金项目
ROBUST语音识别方法的研究
  • 批准号:
    69075008
  • 批准年份:
    1990
  • 资助金额:
    3.5 万元
  • 项目类别:
    面上项目
改进型ROBUST序贯检测技术
  • 批准号:
    68671030
  • 批准年份:
    1986
  • 资助金额:
    2.0 万元
  • 项目类别:
    面上项目

相似海外基金

VIPAuto: Robust and Adaptive Visual Perception for Automated Vehicles in Complex Dynamic Scenes
VIPAuto:复杂动态场景中自动驾驶车辆的鲁棒自适应视觉感知
  • 批准号:
    EP/Y015878/1
  • 财政年份:
    2024
  • 资助金额:
    $ 50万
  • 项目类别:
    Fellowship
CAREER: Game Theoretic Models for Robust Cyber-Physical Interactions: Inference and Design under Uncertainty
职业:稳健的网络物理交互的博弈论模型:不确定性下的推理和设计
  • 批准号:
    2336840
  • 财政年份:
    2024
  • 资助金额:
    $ 50万
  • 项目类别:
    Continuing Grant
CAREER: Structured Minimax Optimization: Theory, Algorithms, and Applications in Robust Learning
职业:结构化极小极大优化:稳健学习中的理论、算法和应用
  • 批准号:
    2338846
  • 财政年份:
    2024
  • 资助金额:
    $ 50万
  • 项目类别:
    Continuing Grant
Robust Transient State Estimation for Three-Phase Power Systems
三相电力系统的鲁棒瞬态估计
  • 批准号:
    2330377
  • 财政年份:
    2024
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
NSF Convergence Accelerator track L: Translating insect olfaction principles into practical and robust chemical sensing platforms
NSF 融合加速器轨道 L:将昆虫嗅觉原理转化为实用且强大的化学传感平台
  • 批准号:
    2344284
  • 财政年份:
    2024
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
Research on Robust Multi-Person Gait Recognition Based on the Combination of Human Mesh Model and Silhouette
基于人体网格模型与剪影相结合的鲁棒多人步态识别研究
  • 批准号:
    24K20794
  • 财政年份:
    2024
  • 资助金额:
    $ 50万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
CAREER: Robust, Fair, and Culturally Aware Commonsense Reasoning in Natural Language
职业:用自然语言进行稳健、公平和具有文化意识的常识推理
  • 批准号:
    2339746
  • 财政年份:
    2024
  • 资助金额:
    $ 50万
  • 项目类别:
    Continuing Grant
CAREER: Optimal Transport Beyond Probability Measures for Robust Geometric Representation Learning
职业生涯:超越概率测量的最佳传输以实现稳健的几何表示学习
  • 批准号:
    2339898
  • 财政年份:
    2024
  • 资助金额:
    $ 50万
  • 项目类别:
    Continuing Grant
Collaborative Research: Robust and miniature laser with tailorable single-mode operation range
合作研究:具有可定制单模工作范围的坚固微型激光器
  • 批准号:
    2411394
  • 财政年份:
    2024
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
CAREER: Robust Reinforcement Learning Under Model Uncertainty: Algorithms and Fundamental Limits
职业:模型不确定性下的鲁棒强化学习:算法和基本限制
  • 批准号:
    2337375
  • 财政年份:
    2024
  • 资助金额:
    $ 50万
  • 项目类别:
    Continuing Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了