Speech Recognition Based on Intelligent Beam Search Algorithm

基于智能波束搜索算法的语音识别

基本信息

  • 批准号:
    01460254
  • 负责人:
  • 金额:
    $ 4.42万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for General Scientific Research (B)
  • 财政年份:
    1989
  • 资助国家:
    日本
  • 起止时间:
    1989 至 1991
  • 项目状态:
    已结题

项目摘要

In a large-vocabulary continuous speech recognition, an investigation of efficient recognition algorithms is extremely important because of executing an enormous computation needed in a matching process within a realistic CPU time. Conventional recognition algorithms based on a dynamic time warping (DTW), a hidden Markov model (HMM) and so on are constructed on the base of an exhaustive search of possible combinations. A dynamic programming technique is introduced to execute the exhaustive search efficiently.The matching process in DTW-based and HMM-based speech recognition systems is regarded as a problem of searching an optimal path through a constrained node. In an application of graph searching algorithms to speechrecognition, two kinds of searching algorithms are effective, that is, a beam searching algorithm and a best-first searching algorithm. A conventional pruning strategy in speech recognition using the beam searching algorithm is based on only a score from the beginning node to the current node. A score estimate from the current node to the terminal node is not used. An A^* algorithm is introduced to speech recognition using the best-first searching algorithm.This report describes new approaches to DTW-based and HMM-based speech recognition algorithms by modeling the matching process from a view point of a graph search. In Chapter I, a DTW-based speech recognition utilizing the beam searching algorithm is described. In Chapter II, a DTW-based speech recognition utilizing the best-first searching algorithm is described. Finally in Chapter III, an HMM-based speech recognition utilizing the best-first searching algorithm is described.
在大词汇量连续语音识别中,高效识别算法的研究是非常重要的,因为匹配过程需要在实际的CPU时间内执行大量的计算。传统的识别算法基于动态时间规整(DTW)、隐马尔可夫模型(HMM)等,是在穷尽搜索可能组合的基础上构建的。为了有效地执行穷举搜索,引入了动态规划技术。在基于dtw和基于hmm的语音识别系统中,匹配过程被认为是一个通过约束节点搜索最优路径的问题。在图搜索算法在语音识别中的应用中,有两种有效的搜索算法,即波束搜索算法和最佳优先搜索算法。传统的基于波束搜索算法的语音识别剪枝策略仅基于起始节点到当前节点的分数。不使用从当前节点到终端节点的分数估计。采用最佳优先搜索算法将A^*算法引入到语音识别中。本报告描述了基于dtw和基于hmm的语音识别算法的新方法,从图搜索的角度对匹配过程进行建模。第一章描述了一种基于波束搜索算法的dtw语音识别方法。第二章描述了一种基于dtw的基于最佳优先搜索算法的语音识别方法。最后,在第三章中,描述了一种基于hmm的语音识别方法。

项目成果

期刊论文数量(50)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
好田 正紀,加藤 正治: "予備選択法を利用するDPビ-ムサ-チの検討" 電子情報通信学会技術研究報告(電子情報通信学会論文誌). SP91ー9. 25-32 (1991)
Masanori Koda,Masaharu Kato:“使用初步选择方法的 DP 波束搜索研究”IEICE 技术研究报告(IEICE 期刊 SP91-32)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
M. Kohda, M. Katoh: ""A study on utilizing a VQ-based preprocessor in DP beam search for speech recognition"" IEICE, Technical Report. SP91-9. (1991)
M. Kohda、M. Katoh:“在 DP 波束搜索中利用基于 VQ 的预处理器进行语音识别的研究””IEICE,技术报告。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
好田 正紀,加藤 正治,伊藤 研司: "DP bestーfirstサ-チにおける推定コストの設定法の検討" 日本音響学会講演論文集. I. (1992)
Masanori Koda、Masaharu Kato、Kenji Ito:“DP 最佳优先搜索中设置估计成本的方法研究”日本声学学会论文集 I. (1992)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
好田 正紀: "予備選択法を利用するDPビ-ムサ-チの検討" 日本音響学会平成3年度春季研究発表会講演論文集. I. (1991)
Masanori Koda:“使用预选方法的 DP 波束搜索研究”日本声学学会 1991 年春季研究会议论文集 I.(1991)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
好田 正紀,北村 達也: "単語音声認識におけるViterbi bestーfirstサ-チの検討" 情報処理学会東北支部研究会(電子情報通信学会論文誌). 91ー3ー7. 1-10 (1992)
Masanori Koda,Tatsuya Kitamura:“单词语音识别中维特比最佳优先搜索的研究”日本信息处理学会东北分会研究小组(IEICE Transactions)91-3-10(1992)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

KOHDA Masaki其他文献

KOHDA Masaki的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('KOHDA Masaki', 18)}}的其他基金

Large-vocabulary continuous speech recognition on spontaneous speech task
自发语音任务的大词汇量连续语音识别
  • 批准号:
    18500126
  • 财政年份:
    2006
  • 资助金额:
    $ 4.42万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Spontaneous speech recognition
自发语音识别
  • 批准号:
    15500098
  • 财政年份:
    2003
  • 资助金额:
    $ 4.42万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Large Vocabulary Continuous Speech Recognition System on Japanese Newspaper Reading Task
日语报纸阅读任务的大词汇量连续语音识别系统
  • 批准号:
    10680368
  • 财政年份:
    1998
  • 资助金额:
    $ 4.42万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Algorithm of Spontaneous Speech Recognition Based on A^<**> Search
基于A^<**>搜索的自发语音识别算法
  • 批准号:
    07680379
  • 财政年份:
    1995
  • 资助金额:
    $ 4.42万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)

相似海外基金

Development of a Parallel Language for Graph Search Applications in Massively Parallel Environments
大规模并行环境中图搜索应用程序的并行语言的开发
  • 批准号:
    17K00099
  • 财政年份:
    2017
  • 资助金额:
    $ 4.42万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Leg trajectory planning using graph search for free gait of multi-legged robot
基于图搜索的多足机器人自由步态腿部轨迹规划
  • 批准号:
    16K00350
  • 财政年份:
    2016
  • 资助金额:
    $ 4.42万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
RI-Small: Structured Duplicate Detection: A New Approach to External-Memory and Parallel Graph Search
RI-Small:结构化重复检测:外部存储器和并行图搜索的新方法
  • 批准号:
    0812558
  • 财政年份:
    2008
  • 资助金额:
    $ 4.42万
  • 项目类别:
    Continuing Grant
Parallel and Sequential Graph Search
并行和顺序图搜索
  • 批准号:
    9319772
  • 财政年份:
    1995
  • 资助金额:
    $ 4.42万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了