SGER: Using Text Coherence and Verbal Valence in Long- Distance N-grams

SGER:在长距离 N 元语法中使用文本连贯性和语言效价

基本信息

  • 批准号:
    9704046
  • 负责人:
  • 金额:
    $ 5万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    1997
  • 资助国家:
    美国
  • 起止时间:
    1997-01-15 至 1997-12-31
  • 项目状态:
    已结题

项目摘要

*** Building better speech recognizers requires augmenting n-gram grammars with sophisticated yet probabilistic linguistic knowledge. This project is building probabilistic models of two important pieces of syntactic/semantic knowledge: verb-argument constraints and semantic text coherence.(1) Verbs place strong constraints on the syntax and semantics of their arguments. This project is computing probabilities for the different argument structures that can co-occur with different verbs, and using these probabilities to augment standard trigram language models.(2) Texts and discourses tend to be semantically coherent;in particular the words that occur in a text tend to be semantically related to each other. This project is applying a model of word meaning called Latent Semantic Analysis (LSA) to ASR LMs. In LSA, a word-similarity metric is defined by computing a large matrix of word co-occurrence probabilities, which are then smoothed via Singular Value Decomposition, resulting in a generalized measure of semantic word-similarity. Trigram models can then increase the probability that similar words will occur near each other. Building these two stochastic models of linguistic knowledge, besides possible application in speech recognition LMs, word-sense disambiguation, or parsing, also helps bridge the gap between the structural models used in linguistics and the statistical models of speech engineering.***
*** 构建更好的语音识别器需要使用复杂且概率性的语言知识来增强 n 元语法。 该项目正在构建两个重要的句法/语义知识的概率模型:动词参数约束和语义文本连贯性。(1)动词对其参数的语法和语义施加了严格的约束。 该项目正在计算可以与不同动词同时出现的不同参数结构的概率,并使用这些概率来增强标准三元组语言模型。(2)文本和话语往往在语义上是连贯的;特别是文本中出现的单词往往在语义上彼此相关。 该项目正在将一种称为潜在语义分析 (LSA) 的词义模型应用于 ASR LM。 在LSA中,单词相似度度量是通过计算单词共现概率的大矩阵来定义的,然后通过奇异值分解对其进行平滑,从而得到语义单词相似度的广义度量。 Trigram 模型可以增加相似单词彼此靠近出现的概率。 构建这两种语言知识的随机模型,除了可能应用于语音识别 LM、词义消歧或解析之外,还有助于弥合语言学中使用的结构模型和语音工程统计模型之间的差距。***

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Daniel Jurafsky其他文献

ReFT: Representation Finetuning for Language Models
ReFT:语言模型的表示微调
  • DOI:
  • 发表时间:
    2024
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Zhengxuan Wu;Aryaman Arora;Zheng Wang;Atticus Geiger;Daniel Jurafsky;Christopher D. Manning;Christopher Potts
  • 通讯作者:
    Christopher Potts

Daniel Jurafsky的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Daniel Jurafsky', 18)}}的其他基金

RI: Small: New tools for studying structural and inductive bias in NLP models
RI:小:研究 NLP 模型中的结构和归纳偏差的新工具
  • 批准号:
    2128145
  • 财政年份:
    2021
  • 资助金额:
    $ 5万
  • 项目类别:
    Continuing Grant
RI: Medium: Deep Understanding: Integrating Neural and Symbolic Models of Meaning
RI:中:深度理解:整合意义的神经模型和符号模型
  • 批准号:
    1514268
  • 财政年份:
    2015
  • 资助金额:
    $ 5万
  • 项目类别:
    Continuing Grant
RI: Small: Learning Meaning and Grammar from Interaction, Context, and the World
RI:小:从互动、情境和世界中学习意义和语法
  • 批准号:
    1216875
  • 财政年份:
    2012
  • 资助金额:
    $ 5万
  • 项目类别:
    Standard Grant
RI-Small: Unsupervised Learning of Meaning
RI-Small:无监督意义学习
  • 批准号:
    0811974
  • 财政年份:
    2008
  • 资助金额:
    $ 5万
  • 项目类别:
    Standard Grant
Modeling Pronunciation Variation for Universal Access to Speech Understanding
为普遍获得语音理解而建模发音变化
  • 批准号:
    9978025
  • 财政年份:
    1999
  • 资助金额:
    $ 5万
  • 项目类别:
    Continuing Grant
CAREER: Spoken Lexical Processing in Humans and Machines
职业:人类和机器的口语词汇处理
  • 批准号:
    9733067
  • 财政年份:
    1998
  • 资助金额:
    $ 5万
  • 项目类别:
    Continuing Grant

相似国自然基金

Molecular Interaction Reconstruction of Rheumatoid Arthritis Therapies Using Clinical Data
  • 批准号:
    31070748
  • 批准年份:
    2010
  • 资助金额:
    34.0 万元
  • 项目类别:
    面上项目

相似海外基金

Understanding Processes of Neighborhood Change using Property Text Analytics
使用属性文本分析了解社区变化的过程
  • 批准号:
    2314726
  • 财政年份:
    2023
  • 资助金额:
    $ 5万
  • 项目类别:
    Standard Grant
Constructing a large-scale biomedical knowledge graph using all PubMed abstracts and PMC full-text articles and its applications
利用所有PubMed摘要和PMC全文文章构建大规模生物医学知识图谱及其应用
  • 批准号:
    10648553
  • 财政年份:
    2023
  • 资助金额:
    $ 5万
  • 项目类别:
Using artificially intelligent text messaging technology to improve American Heart Association's Life's Simple 7 Health Behaviors: LS7 Bot + Backup
利用人工智能短信技术改善美国心脏协会的生活简单7个健康行为:LS7 Bot Backup
  • 批准号:
    10649884
  • 财政年份:
    2023
  • 资助金额:
    $ 5万
  • 项目类别:
Research on Gender Differences in Entrepreneurship Using Text Mining
基于文本挖掘的创业性别差异研究
  • 批准号:
    23K01607
  • 财政年份:
    2023
  • 资助金额:
    $ 5万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Metacognition in Language Models: Using Model Confidence for Improved Natural Language Text Generation
语言模型中的元认知:利用模型置信度改进自然语言文本生成
  • 批准号:
    575626-2022
  • 财政年份:
    2022
  • 资助金额:
    $ 5万
  • 项目类别:
    Alexander Graham Bell Canada Graduate Scholarships - Master's
New approaches to computational natural language processing using ancient Near Eastern text corpora
使用古代近东文本语料库进行计算自然语言处理的新方法
  • 批准号:
    547773-2020
  • 财政年份:
    2022
  • 资助金额:
    $ 5万
  • 项目类别:
    Alexander Graham Bell Canada Graduate Scholarships - Doctoral
Generating Personalized Synthetic Speech for Progressive Dysarthria Using Severity-Appropriate Adaptation Strategies for Neural Text-to-Speech and Voice Conversion
使用神经文本到语音和语音转换的严重程度适当的适应策略为进行性构音障碍生成个性化合成语音
  • 批准号:
    10525903
  • 财政年份:
    2022
  • 资助金额:
    $ 5万
  • 项目类别:
An innovative portable device using best-of-breed technology to enable users with learning disabilities to read text while analysing their progress
一款创新的便携式设备,采用同类最佳技术,使有学习障碍的用户能够在分析其进度的同时阅读文本
  • 批准号:
    10035567
  • 财政年份:
    2022
  • 资助金额:
    $ 5万
  • 项目类别:
    Collaborative R&D
Identification of Monetary Policy Shocks Using Text Data and High-Frequency Data
使用文本数据和高频数据识别货币政策冲击
  • 批准号:
    22J12457
  • 财政年份:
    2022
  • 资助金额:
    $ 5万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
Mum's the word... using text analysis to better understand expressions and experiences related to fertility
妈妈的话......使用文本分析来更好地理解与生育相关的表达和经历
  • 批准号:
    2751132
  • 财政年份:
    2022
  • 资助金额:
    $ 5万
  • 项目类别:
    Studentship
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了