Study of Effective Speech Recognition based on the Bi-directional Search Algorithm

基于双向搜索算法的有效语音识别研究

基本信息

  • 批准号:
    07680401
  • 负责人:
  • 金额:
    $ 1.28万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
  • 财政年份:
    1995
  • 资助国家:
    日本
  • 起止时间:
    1995 至 1997
  • 项目状态:
    已结题

项目摘要

The most widely used search strategy in continuous speech recognition is the left-to-right time-synchronous search. However, the left-to-right strategy often produces erroneous results because it does not utilize a full path score. In this research project, we studied a bi-directional search algorithm consisting of a forward time-synchronous search and a backward time-asynchronous search. In the first pass, the HMM-based one-pass algorithm, guided by a finite-state automaton (FSA), is used time-asynchronously for preparing a partial path map. Here, the partial path map keeps recognition likelihood of all partial paths that lead to any grammar state at every time instant. After the first pass, a new, forward time-synchronous search, guided by a finite-state or context-free grammar (CFG), is performed for finding the best recognition hypothesis. The second pass uses the partial path map to compute the full path likelihood.We implemented an experimental speech recognition system based on the above-mentioned bi-directional search algorithm. In the system, discrete HMMs were used as acoustic models. We also conducted experiments to compare the accuracy of several kinds of search strategies using the ATR speech database. FSA-based one-directional search attained an accuracy of 77.1%-87.3%, while FSA-backward CGF-forward search attained an accuracy of 88.6%. These results shows the effectiveness of the bi-directional search algorithm.
在连续语音识别中,最广泛使用的搜索策略是从左到右的时间同步搜索。然而,从左到右的策略经常产生错误的结果,因为它没有利用完整的路径得分。在本研究计画中,我们研究了一种双向搜寻演算法,包含正向时间同步搜寻与反向时间异步搜寻。在第一遍中,基于HMM的一遍算法,由有限状态自动机(FSA)的指导下,时间异步地用于准备部分路径图。这里,部分路径图保持在每个时刻导致任何语法状态的所有部分路径的识别可能性。在第一遍之后,执行由有限状态或上下文无关语法(CFG)引导的新的向前时间同步搜索,以寻找最佳识别假设。第二步利用部分路径图计算全路径似然度。基于上述双向搜索算法,我们实现了一个实验语音识别系统。在系统中,离散的Hyns被用作声学模型。我们也使用ATR语音资料库进行实验,比较几种搜寻策略的准确度。基于FSA的单向搜索的准确率为77.1%-87.3%,而FSA-向后CGF-向前搜索的准确率为88.6%。这些结果表明了双向搜索算法的有效性。

项目成果

期刊论文数量(28)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
小田 裕樹, 北 研二: "単語の位置情報に基づくコーパスからのコロケーションの自動抽出" 自然言語処理. 5・1. 79-99 (1998)
Hiroki Oda、Kenji Kita:“根据单词位置信息从语料库中自动提取搭配”自然语言处理 5・1(1998)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Kenji Kita: "Dialogue Knowledge Acquisition from Annotated Corpora" Proceedings of IEEE SMC96. 556-561 (1996)
Kenji Kita:“从注释语料库中获取对话知识”IEEE SMC96 论文集。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Tatsuya Iwasa: "Error Correction of Speech Recognition Outputs Using Generalized LR Parsing and Confusion Matrix" Proceedings of ROCLING VIII. 101-110 (1995)
Tatsuya Iwasa:“使用广义 LR 解析和混淆矩阵对语音识别输出进行纠错”ROCLING VIII 论文集。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Kenji Kita et al.: "One-Pass Scarch Algorithm for Continuous Speech Recognition Using Generalized LR Parsing:A CFG-Driven.Frame-Synchronous HMM-Based Approach" Transactions of IPSJ. 36・5. 1252-1259 (1995)
Kenji Kita 等人:“使用广义 LR 解析进行连续语音识别的单通道 Scarch 算法:基于 CFG 的帧同步 HMM 方法” IPSJ 36・5(1995 年)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
kenji Kita et al.: "Automatic Acquisition of Probabilistic Dialogue Models" Proceedings of ICSLP96. 196-199 (1996)
kenji Kita 等人:“概率对话模型的自动获取”ICSLP96 论文集。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

KITA Kenji其他文献

KITA Kenji的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('KITA Kenji', 18)}}的其他基金

Metastasis initiating cell of lung cancer brain metastases
肺癌脑转移的转移起始细胞
  • 批准号:
    24659403
  • 财政年份:
    2012
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Challenging Exploratory Research
Semantic and Affective Multimedia Retrieval using EEG-based Biological Information
使用基于脑电图的生物信息进行语义和情感多媒体检索
  • 批准号:
    21300036
  • 财政年份:
    2009
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Study of Class-based Language Model and its Application to Japanese Morphological Analysis
基于类的语言模型研究及其在日语词法分析中的应用
  • 批准号:
    10680383
  • 财政年份:
    1998
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了