RI: Small: A Bayesian Approach to Dynamic Lexical Resources for Flexible Language Processing
RI:小:用于灵活语言处理的动态词汇资源的贝叶斯方法
基本信息
- 批准号:1116782
- 负责人:
- 金额:$ 30万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Continuing Grant
- 财政年份:2011
- 资助国家:美国
- 起止时间:2011-09-01 至 2015-08-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
This project uses statistical models and human judgment to determine dynamic, probabilistic representations of extensible usages of words; these representations are suitable for incorporation into VerbNet, a lexical resource widely used in the Natural Language Processing (NLP) community. Existing lexical resources reflect a binary notion of usages as grammatical or not. However, in actual language use, forms vary in acceptability; moreover, the process of coercion extends words beyond their standard usages. For example, a strictly intransitive action verb such as 'sneeze' may be used as in 'She sneezed the foam off the cappuccino', expressing manner of motion. This research has a two-pronged approach involving extensive use of machine learning and a fundamental shift in the development and use of VerbNet. Specifically, the research develops probabilistic methods for: (1) analyzing usages of verbs in large corpora and incorporating the resulting probabilistic information into VerbNet classes; and (2) representing information about the likelihood of potential constructional coercions and the productivity of such extensions. These developments use the Hierarchical Bayesian Model of Parisien and Stevenson, which are an ideal framework for marrying probabilistic reasoning about complex, real-world data within the hierarchically-organized VerbNet lexicon. In addition to statistical models, the representations are also informed by human judgments with respect to the use of such constructions. Thus, this research enriches the current symbolic verb representations in VerbNet with probabilistic distributional information, which becomes salient through the influence of construction grammar. Encoding verb knowledge probabilistically provides the necessary flexibility to represent extensional constructions and support their appropriate interpretation by NLP systems. This is especially useful for interpretation in new domains and genres, leading to advances in NLP technologies, such as question answering and machine translation, thus improving information access. Additionally, insights into statistical properties of constructions gained through this research are valuable for psycholinguistic models of language acquisition and second language learning.
该项目使用统计模型和人类判断来确定单词可扩展用法的动态概率表示;这些表示适合合并到vernet中,这是一个在自然语言处理(NLP)社区中广泛使用的词汇资源。现有的词汇资源反映了用法是否合乎语法的二元概念。然而,在实际语言使用中,形式的可接受性各不相同;此外,强制的过程使词汇超出了它们的标准用法。例如,一个严格的不及物动词,如“sneeze”,可以用在“She sneeze the foam off the cappuccino”中,表达运动的方式。这项研究有一个双管齐下的方法,包括广泛使用机器学习和从根本上改变vernet的开发和使用。具体而言,该研究开发了概率方法:(1)分析大型语料库中的动词用法,并将得到的概率信息整合到动词网络类中;(2)表示关于潜在构造强制的可能性和这种扩展的生产力的信息。这些发展使用了Parisien和Stevenson的分层贝叶斯模型,这是一个理想的框架,可以将复杂的真实世界数据的概率推理与分层组织的vernet词典结合起来。除了统计模型之外,这些表示也通过人类对这些结构的使用的判断来告知。因此,本研究以概率分布信息丰富了动词网络中现有的符号动词表征,这在构式语法的影响下变得更加突出。动词知识的概率编码为表示外延结构提供了必要的灵活性,并支持NLP系统对其进行适当的解释。这对于新领域和新体裁的翻译尤其有用,导致了NLP技术的进步,例如问答和机器翻译,从而改善了信息访问。此外,通过本研究获得的关于结构统计特性的见解对语言习得和第二语言学习的心理语言学模型有价值。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Martha Palmer其他文献
A Case for Rule-Driven Semantic Processing
规则驱动的语义处理案例
- DOI:
10.3115/981923.981958 - 发表时间:
1981 - 期刊:
- 影响因子:0
- 作者:
Martha Palmer - 通讯作者:
Martha Palmer
A Large-Scale Extension of VerbNet with Novel Verb Classes
VerbNet 的大规模扩展与新颖的动词类
- DOI:
- 发表时间:
2006 - 期刊:
- 影响因子:0
- 作者:
K. Kipper;A. Korhonen;Neville Ryant;Martha Palmer - 通讯作者:
Martha Palmer
VerbNet Representations: Subevent Semantics for Transfer Verbs
VerbNet 表示:转移动词的子事件语义
- DOI:
10.18653/v1/w19-3318 - 发表时间:
2019 - 期刊:
- 影响因子:0
- 作者:
S. Brown;Julia Bonn;James Gung;A. Zaenen;J. Pustejovsky;Martha Palmer - 通讯作者:
Martha Palmer
Good Seed Makes a Good Crop: Accelerating Active Learning Using Language Modeling
好种子结出好庄稼:使用语言建模加速主动学习
- DOI:
- 发表时间:
2011 - 期刊:
- 影响因子:0
- 作者:
Dmitriy Dligach;Martha Palmer - 通讯作者:
Martha Palmer
SCI 3.0: A Web-based Schema Curation Interface for Graphical Event Representations
SCI 3.0:用于图形事件表示的基于 Web 的模式管理界面
- DOI:
- 发表时间:
2024 - 期刊:
- 影响因子:0
- 作者:
Reece Suchocki;Mary Martin;Martha Palmer;S. Brown - 通讯作者:
S. Brown
Martha Palmer的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Martha Palmer', 18)}}的其他基金
RI:Medium:Collaborative Research: Developing a Uniform Meaning Representation for Natural Language Processing
RI:中:协作研究:为自然语言处理开发统一的含义表示
- 批准号:
1764048 - 财政年份:2018
- 资助金额:
$ 30万 - 项目类别:
Standard Grant
CI-P: Collaborative Research: LexLink: Aligning WordNet, FrameNet, PropBank and VerbNet
CI-P:协作研究:LexLink:对齐 WordNet、FrameNet、PropBank 和 VerbNet
- 批准号:
1205484 - 财政年份:2012
- 资助金额:
$ 30万 - 项目类别:
Standard Grant
RI: Large: Collaborative Research: Richer Representations for Machine Translation
RI:大型:协作研究:更丰富的机器翻译表示
- 批准号:
0910992 - 财政年份:2009
- 资助金额:
$ 30万 - 项目类别:
Continuing Grant
Collaborative Research: CRI: CRD: A Multi-Representational and Multi-Layered Treebank for Hindi/Urdu
合作研究:CRI:CRD:印地语/乌尔都语的多表征和多层树库
- 批准号:
0751202 - 财政年份:2008
- 资助金额:
$ 30万 - 项目类别:
Continuing Grant
CRI:CRD Collaborative Research: General Techniques for Creating Treebanks with Multiple Representations: A Large-Scale Russian Application
CRI:CRD 协作研究:创建具有多种表示的树库的通用技术:俄罗斯的大规模应用
- 批准号:
0709167 - 财政年份:2007
- 资助金额:
$ 30万 - 项目类别:
Standard Grant
Advancing the Performance of Word Sense Disambiguation by Finding Consistent Criteria for Sense Distinctions
通过寻找语义区分的一致标准来提高词义消歧的性能
- 批准号:
0715078 - 财政年份:2006
- 资助金额:
$ 30万 - 项目类别:
Continuing Grant
Advancing the Performance of Word Sense Disambiguation by Finding Consistent Criteria for Sense Distinctions
通过寻找语义区分的一致标准来提高词义消歧的性能
- 批准号:
0415923 - 财政年份:2004
- 资助金额:
$ 30万 - 项目类别:
Continuing Grant
MLIAM: ISLE-International Standards for Language Engineering
MLIAM:ISLE-语言工程国际标准
- 批准号:
9910603 - 财政年份:2000
- 资助金额:
$ 30万 - 项目类别:
Continuing Grant
Associating Semantic features with Intersective Levin classes
将语义特征与 Intersective Levin 类关联
- 批准号:
9800658 - 财政年份:1998
- 资助金额:
$ 30万 - 项目类别:
Continuing Grant
Experimenting with Different Control Structures for Text Analysis
尝试不同的控制结构进行文本分析
- 批准号:
9412898 - 财政年份:1995
- 资助金额:
$ 30万 - 项目类别:
Standard Grant
相似国自然基金
昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
- 批准号:
- 批准年份:2024
- 资助金额:0.0 万元
- 项目类别:省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
- 批准号:n/a
- 批准年份:2022
- 资助金额:10.0 万元
- 项目类别:省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
- 批准号:32000033
- 批准年份:2020
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
- 批准号:31972324
- 批准年份:2019
- 资助金额:58.0 万元
- 项目类别:面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
- 批准号:81900988
- 批准年份:2019
- 资助金额:21.0 万元
- 项目类别:青年科学基金项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
- 批准号:31802058
- 批准年份:2018
- 资助金额:26.0 万元
- 项目类别:青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
- 批准号:31870821
- 批准年份:2018
- 资助金额:56.0 万元
- 项目类别:面上项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
- 批准号:31772128
- 批准年份:2017
- 资助金额:60.0 万元
- 项目类别:面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
- 批准号:81704176
- 批准年份:2017
- 资助金额:20.0 万元
- 项目类别:青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
- 批准号:91640114
- 批准年份:2016
- 资助金额:85.0 万元
- 项目类别:重大研究计划
相似海外基金
RI: Small: Enabling Interpretable AI via Bayesian Deep Learning
RI:小型:通过贝叶斯深度学习实现可解释的人工智能
- 批准号:
2127918 - 财政年份:2021
- 资助金额:
$ 30万 - 项目类别:
Continuing Grant
RI: Small: New Directions in Probabilistic Deep Learning: Exponential Families, Bayesian Nonparametrics and Empirical Bayes
RI:小:概率深度学习的新方向:指数族、贝叶斯非参数和经验贝叶斯
- 批准号:
2127869 - 财政年份:2021
- 资助金额:
$ 30万 - 项目类别:
Standard Grant
SHF: Small: Enabling On-Device Bayesian Neural Network Training via An Integrated Architecture-System Approach
SHF:小型:通过集成架构系统方法实现设备上贝叶斯神经网络训练
- 批准号:
2130688 - 财政年份:2021
- 资助金额:
$ 30万 - 项目类别:
Standard Grant
The method to determine the probability of disease severity by bayesian statistical analysis in a small number of patient data.
通过对少量患者数据进行贝叶斯统计分析来确定疾病严重程度概率的方法。
- 批准号:
20K12716 - 财政年份:2020
- 资助金额:
$ 30万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
III: Small: Collaborative Research: Scalable Deep Bayesian Tensor Decomposition
III:小:协作研究:可扩展的深贝叶斯张量分解
- 批准号:
1910983 - 财政年份:2019
- 资助金额:
$ 30万 - 项目类别:
Standard Grant
III: Small: Collaborative Research: Scalable Deep Bayesian Tensor Decomposition
III:小:协作研究:可扩展的深贝叶斯张量分解
- 批准号:
1909912 - 财政年份:2019
- 资助金额:
$ 30万 - 项目类别:
Standard Grant
RIDIR: Collaborative Research: Bayesian analytical tools to improve survey estimates for subpopulations and small areas
RIDIR:协作研究:贝叶斯分析工具,用于改进亚人群和小区域的调查估计
- 批准号:
1926424 - 财政年份:2019
- 资助金额:
$ 30万 - 项目类别:
Standard Grant
RIDIR: Collaborative Research: Bayesian analytical tools to improve survey estimates for subpopulations and small areas
RIDIR:协作研究:贝叶斯分析工具,用于改进亚人群和小区域的调查估计
- 批准号:
1926578 - 财政年份:2019
- 资助金额:
$ 30万 - 项目类别:
Standard Grant
RTML: Small: Real-Time Model-Based Bayesian Reinforcement Learning
RTML:小型:基于实时模型的贝叶斯强化学习
- 批准号:
1937396 - 财政年份:2019
- 资助金额:
$ 30万 - 项目类别:
Standard Grant
Bayesian spatial statistics for small area estimation of HIV
用于 HIV 小区域估计的贝叶斯空间统计
- 批准号:
2605899 - 财政年份:2019
- 资助金额:
$ 30万 - 项目类别:
Studentship