Speech Recognition Based on Intelligent Beam Search Algorithm
基于智能波束搜索算法的语音识别
基本信息
- 批准号:01460254
- 负责人:
- 金额:$ 4.42万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for General Scientific Research (B)
- 财政年份:1989
- 资助国家:日本
- 起止时间:1989 至 1991
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
In a large-vocabulary continuous speech recognition, an investigation of efficient recognition algorithms is extremely important because of executing an enormous computation needed in a matching process within a realistic CPU time. Conventional recognition algorithms based on a dynamic time warping (DTW), a hidden Markov model (HMM) and so on are constructed on the base of an exhaustive search of possible combinations. A dynamic programming technique is introduced to execute the exhaustive search efficiently.The matching process in DTW-based and HMM-based speech recognition systems is regarded as a problem of searching an optimal path through a constrained node. In an application of graph searching algorithms to speechrecognition, two kinds of searching algorithms are effective, that is, a beam searching algorithm and a best-first searching algorithm. A conventional pruning strategy in speech recognition using the beam searching algorithm is based on only a score from the beginning node to the current node. A score estimate from the current node to the terminal node is not used. An A^* algorithm is introduced to speech recognition using the best-first searching algorithm.This report describes new approaches to DTW-based and HMM-based speech recognition algorithms by modeling the matching process from a view point of a graph search. In Chapter I, a DTW-based speech recognition utilizing the beam searching algorithm is described. In Chapter II, a DTW-based speech recognition utilizing the best-first searching algorithm is described. Finally in Chapter III, an HMM-based speech recognition utilizing the best-first searching algorithm is described.
在大词汇量连续语音识别中,高效识别算法的研究极其重要,因为在实际的 CPU 时间内执行匹配过程所需的大量计算。基于动态时间规整(DTW)、隐马尔可夫模型(HMM)等的传统识别算法是在对可能组合的穷举搜索的基础上构建的。引入动态规划技术来有效地执行穷举搜索。基于DTW和基于HMM的语音识别系统中的匹配过程被视为通过受约束节点搜索最优路径的问题。图搜索算法在语音识别中的应用中,有效的搜索算法有两种,即波束搜索算法和最佳优先搜索算法。使用波束搜索算法的语音识别中的传统修剪策略仅基于从开始节点到当前节点的分数。不使用从当前节点到终端节点的分数估计。使用最佳优先搜索算法将 A^* 算法引入语音识别。本报告通过从图搜索的角度对匹配过程进行建模,描述了基于 DTW 和基于 HMM 的语音识别算法的新方法。第一章描述了一种利用波束搜索算法的基于DTW的语音识别。第二章描述了一种利用最佳优先搜索算法的基于DTW的语音识别。最后在第三章中,描述了一种利用最佳优先搜索算法的基于HMM的语音识别。
项目成果
期刊论文数量(50)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
好田 正紀,加藤 正治: "予備選択法を利用するDPビ-ムサ-チの検討" 電子情報通信学会技術研究報告(電子情報通信学会論文誌). SP91ー9. 25-32 (1991)
Masanori Koda,Masaharu Kato:“使用初步选择方法的 DP 波束搜索研究”IEICE 技术研究报告(IEICE 期刊 SP91-32)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
M. Kohda, M. Katoh: ""A study on utilizing a VQ-based preprocessor in DP beam search for speech recognition"" IEICE, Technical Report. SP91-9. (1991)
M. Kohda、M. Katoh:“在 DP 波束搜索中利用基于 VQ 的预处理器进行语音识别的研究””IEICE,技术报告。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
好田 正紀,加藤 正治,伊藤 研司: "DP bestーfirstサ-チにおける推定コストの設定法の検討" 日本音響学会講演論文集. I. (1992)
Masanori Koda、Masaharu Kato、Kenji Ito:“DP 最佳优先搜索中设置估计成本的方法研究”日本声学学会论文集 I. (1992)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
好田 正紀: "予備選択法を利用するDPビ-ムサ-チの検討" 日本音響学会平成3年度春季研究発表会講演論文集. I. (1991)
Masanori Koda:“使用预选方法的 DP 波束搜索研究”日本声学学会 1991 年春季研究会议论文集 I.(1991)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
好田 正紀,北村 達也: "単語音声認識におけるViterbi bestーfirstサ-チの検討" 情報処理学会東北支部研究会(電子情報通信学会論文誌). 91ー3ー7. 1-10 (1992)
Masanori Koda,Tatsuya Kitamura:“单词语音识别中维特比最佳优先搜索的研究”日本信息处理学会东北分会研究小组(IEICE Transactions)91-3-10(1992)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
KOHDA Masaki其他文献
KOHDA Masaki的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('KOHDA Masaki', 18)}}的其他基金
Large-vocabulary continuous speech recognition on spontaneous speech task
自发语音任务的大词汇量连续语音识别
- 批准号:
18500126 - 财政年份:2006
- 资助金额:
$ 4.42万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Spontaneous speech recognition
自发语音识别
- 批准号:
15500098 - 财政年份:2003
- 资助金额:
$ 4.42万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Large Vocabulary Continuous Speech Recognition System on Japanese Newspaper Reading Task
日语报纸阅读任务的大词汇量连续语音识别系统
- 批准号:
10680368 - 财政年份:1998
- 资助金额:
$ 4.42万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Algorithm of Spontaneous Speech Recognition Based on A^<**> Search
基于A^<**>搜索的自发语音识别算法
- 批准号:
07680379 - 财政年份:1995
- 资助金额:
$ 4.42万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
相似海外基金
Development of a Parallel Language for Graph Search Applications in Massively Parallel Environments
大规模并行环境中图搜索应用程序的并行语言的开发
- 批准号:
17K00099 - 财政年份:2017
- 资助金额:
$ 4.42万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Leg trajectory planning using graph search for free gait of multi-legged robot
基于图搜索的多足机器人自由步态腿部轨迹规划
- 批准号:
16K00350 - 财政年份:2016
- 资助金额:
$ 4.42万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
RI-Small: Structured Duplicate Detection: A New Approach to External-Memory and Parallel Graph Search
RI-Small:结构化重复检测:外部存储器和并行图搜索的新方法
- 批准号:
0812558 - 财政年份:2008
- 资助金额:
$ 4.42万 - 项目类别:
Continuing Grant














{{item.name}}会员




