Improved Statistical Language Models

改进的统计语言模型

基本信息

  • 批准号:
    9319516
  • 负责人:
  • 金额:
    $ 24.13万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Continuing Grant
  • 财政年份:
    1994
  • 资助国家:
    美国
  • 起止时间:
    1994-09-01 至 1998-08-31
  • 项目状态:
    已结题

项目摘要

9319516 Charniak This is the first-year award of a three-year continuing grant to study the use of probabilities and probabilistic language models in context-free parsing applications. The research consists of four parts: 1) use of probabilities in the syntactic parsing of English through automatic generation of a probabilistic grammar by applying standard statistical techniques to corpora that has been hand- tagged; 2) a portion of the resources in the statistical analysis involves the co-occurrence of words, which improves the effectiveness of the language model thereby helping the determination in the parse that, for example, a noun would be more likely in a certain position than another, rather than just the parts-of-speech results that would be obtained via a classical parser; 3) it is anticipated that some level of semantic generalization may be possible by grouping the words with similar statistics in classes, as statistical parameters are smoothed; and finally, 4) the model obtained and smoothed is rigorously tested through an objective quality measure such as the per-word cross entropy. The goal is to improve upon existing trigram models, currently in use in speech recognition, and to work towards better language understanding systems.
9319516 Charniak这是为期三年的持续资助的第一年,用于研究概率和概率语言模型在上下文无关分析应用程序中的使用。这项研究包括四个部分:1)通过对手工标注的语料库应用标准统计技术,通过自动生成概率语法,在英语句法分析中使用概率;2)统计分析中的部分资源涉及单词的共现,这提高了语言模型的有效性,从而有助于在句法分析中确定,例如,一个名词在某个位置比在另一个位置更有可能,而不仅仅是通过经典句法分析器获得的词性结果;3)随着统计参数被平滑,可以通过将具有相似统计的词分组在类中来实现某种程度的语义泛化;以及最后,通过诸如每词交叉熵的客观质量度量来严格测试所获得和平滑的模型。目标是改进目前在语音识别中使用的现有三元模型,并努力实现更好的语言理解系统。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Eugene Charniak其他文献

Framed PAINTING: The Representation of a Common Sense Knowledge Fragment
带框绘画:常识知识片段的表征
  • DOI:
  • 发表时间:
    1977
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Eugene Charniak
  • 通讯作者:
    Eugene Charniak
A Common Representation for Problem-Solving and Language-Comprehension Information
解决问题和语言理解信息的通用表示
  • DOI:
    10.1016/0004-3702(81)90001-1
  • 发表时间:
    1981
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Eugene Charniak
  • 通讯作者:
    Eugene Charniak
Re-thinking Supertags in Linear Context-free Rewriting Systems for Constituency Parsing
重新思考用于选区解析的线性上下文无关重写系统中的超级标签
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Srinivas Bangalore;Aravind K. Joshi;Su;Sabine Brants;Stefanie Dipper;Peter Eisenberg;Sil;Esther K¨onig;Wolfgang Lezius;Branden Chan;Stefan Schweter;Eugene Charniak;Mark Johnson;Micha Elsner;David Austerweil;Isaac Ellis;Catherine Haxton;R. Hill;Jeremy Shrivaths;Michael Moore;Pozar;J. Devlin;Ming;Kenton Lee
  • 通讯作者:
    Kenton Lee
Figures of Merit for Best-First Probabilistic Chart Parsing
最佳优先概率图解析的品质因数
  • DOI:
  • 发表时间:
    1996
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Sharon A. Caraballo;Eugene Charniak
  • 通讯作者:
    Eugene Charniak
Toward a model of children's story comprehension
  • DOI:
  • 发表时间:
    1972-12
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Eugene Charniak
  • 通讯作者:
    Eugene Charniak

Eugene Charniak的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Eugene Charniak', 18)}}的其他基金

EAGER: Construction of Inter-Igbo
EAGER:Inter-Igbo 的建设
  • 批准号:
    1240178
  • 财政年份:
    2012
  • 资助金额:
    $ 24.13万
  • 项目类别:
    Standard Grant
ITR/SY(CISE) Learning Syntactic/Semantic Information for Parsing
ITR/SY(CISE) 学习用于解析的句法/语义信息
  • 批准号:
    0112435
  • 财政年份:
    2001
  • 资助金额:
    $ 24.13万
  • 项目类别:
    Standard Grant
Probability and Natural Language Processing
概率与自然语言处理
  • 批准号:
    8911122
  • 财政年份:
    1989
  • 资助金额:
    $ 24.13万
  • 项目类别:
    Continuing Grant
Multiparadigm Design Environments
多范式设计环境
  • 批准号:
    8722809
  • 财政年份:
    1988
  • 资助金额:
    $ 24.13万
  • 项目类别:
    Continuing Grant
A Single-Semantic-Process Theory of Parsing (Information Science)
解析的单语义过程理论(信息科学)
  • 批准号:
    8515005
  • 财政年份:
    1986
  • 资助金额:
    $ 24.13万
  • 项目类别:
    Continuing Grant
An Approach to Abductive Inference in Artificial Intelligence Systems (Information Science)
人工智能系统中的溯因推理方法(信息科学)
  • 批准号:
    8416034
  • 财政年份:
    1985
  • 资助金额:
    $ 24.13万
  • 项目类别:
    Standard Grant
Research on Natural Language Processing (Frame Selection)
自然语言处理研究(帧选择)
  • 批准号:
    8013690
  • 财政年份:
    1981
  • 资助金额:
    $ 24.13万
  • 项目类别:
    Standard Grant
Computer Science and Computer Engineering Research Equipment
计算机科学与计算机工程研究设备
  • 批准号:
    7907810
  • 财政年份:
    1979
  • 资助金额:
    $ 24.13万
  • 项目类别:
    Standard Grant

相似海外基金

Study of Human Statistical Biases on Unsupervised Parsing and Language Modeling
无监督句法分析和语言建模的人类统计偏差研究
  • 批准号:
    23KJ0565
  • 财政年份:
    2023
  • 资助金额:
    $ 24.13万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
Doctoral Dissertation Research: The Effects of Language Experience on Statistical Learning in Infants and Adults
博士论文研究:语言体验对婴儿和成人统计学习的影响
  • 批准号:
    2234422
  • 财政年份:
    2023
  • 资助金额:
    $ 24.13万
  • 项目类别:
    Standard Grant
The role of statistical learning in predicting child language outcomes.
统计学习在预测儿童语言结果中的作用。
  • 批准号:
    10810207
  • 财政年份:
    2023
  • 资助金额:
    $ 24.13万
  • 项目类别:
Predicting language and literacy growth in children with ASD using statistical learning
使用统计学习预测自闭症儿童的语言和识字能力增长
  • 批准号:
    10862023
  • 财政年份:
    2023
  • 资助金额:
    $ 24.13万
  • 项目类别:
The role of statistical learning in predicting child language outcomes.
统计学习在预测儿童语言结果中的作用。
  • 批准号:
    10671691
  • 财政年份:
    2023
  • 资助金额:
    $ 24.13万
  • 项目类别:
Statistical Learning in Infant Language Acquisition
婴儿语言习得的统计学习
  • 批准号:
    10387382
  • 财政年份:
    2022
  • 资助金额:
    $ 24.13万
  • 项目类别:
Valid N-Grams Identification Web Service based on Statistical Natural Language Processing Techniques
基于统计自然语言处理技术的有效N-Grams识别Web服务
  • 批准号:
    579993-2022
  • 财政年份:
    2022
  • 资助金额:
    $ 24.13万
  • 项目类别:
    University Undergraduate Student Research Awards
Statistical Learning in Infant Language Acquisition
婴儿语言习得的统计学习
  • 批准号:
    10672168
  • 财政年份:
    2022
  • 资助金额:
    $ 24.13万
  • 项目类别:
Incremental Comprehension during First and Second Language Reading of Authentic Texts Assessed through Statistical Models, ERPs, and Behavioral Measures
通过统计模型、ERP 和行为测量评估第一语言和第二语言阅读真实文本期间的增量理解
  • 批准号:
    2118195
  • 财政年份:
    2021
  • 资助金额:
    $ 24.13万
  • 项目类别:
    Standard Grant
Testing the Role of Statistical Learning in Infant Language Development
测试统计学习在婴儿语言发展中的作用
  • 批准号:
    2884002
  • 财政年份:
    2020
  • 资助金额:
    $ 24.13万
  • 项目类别:
    Studentship
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了