Development of Noise Robust Speech Recognition and Its Application on Mobile Environment
噪声鲁棒语音识别的发展及其在移动环境下的应用
基本信息
- 批准号:16500097
- 负责人:
- 金额:$ 1.86万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research (C)
- 财政年份:2004
- 资助国家:日本
- 起止时间:2004 至 2006
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
1) Noisy speech recognition using DMHMMsWe have proposed new methods of robust speech recognition using discrete-mixture HMMs (DMHMMs). The aim of this work is to develop robust speech recognition for adverse conditions that contain both stationary and non-stationary noise. In particular, we focus on the issue of impulsive noise, which is a major problem in practical speech recognition system. In order to solve the problem, we have proposed two methods. First, an estimation method of DMHMM parameters based on MAP has been proposed aiming to improve trainability. The second is a method of compensating the observation probabilities of DMHMMs by threshold to reduce adverse effect of outlier values. Experimental evaluations on Japanese LVCSR for read newspaper speech showed that the proposed method achieved the average error rate reduction of 28.1% in adverse conditions that contain both stationary and impulsive noises.2) Model Based Histogram Equalization for Noise Robust Speech Recognition by Using DMHMMsTowards further improvement of noisy speech recognition, we have proposed a novel normalization method for codebooks of DMHMMs in this paper. The codebook normalization method is based on histogram equalization (HEQ) and it can compensate the non-linear effects of additive noise in model space. The proposed method was compared with both conventional continuous-mixture HMMs (CHMMs) and DMHMMs. It showed that the proposed method obtained the best performance, and obtained an average relative improvement of 29.2% over the CHMM baseline.
1)基于DMHMM的噪声语音识别我们提出了一种基于离散混合HMM(DMHMM)的鲁棒语音识别方法。这项工作的目的是发展强大的语音识别的不利条件下,包含平稳和非平稳噪声。特别是,我们专注于脉冲噪声的问题,这是一个主要的问题,在实际的语音识别系统。为了解决这个问题,我们提出了两种方法。首先,提出了一种基于MAP的DMHMM参数估计方法,旨在提高可训练性。第二种方法是通过阈值补偿DMH的观测概率,以减少离群值的不利影响。实验结果表明,该方法在含有平稳噪声和脉冲噪声的恶劣环境下,平均错误率降低了28.1%。2)基于模型的直方图均衡的DMHMM抗噪语音识别为了进一步提高含噪语音识别的性能,本文提出了一种新的DMHMM码本归一化方法。码书归一化方法是基于直方图均衡(HEQ),它可以补偿模型空间中的加性噪声的非线性影响。将所提出的方法与传统的连续混合隐马尔可夫模型(CHMM)和DMHMM进行了比较。结果表明,该方法获得了最好的性能,并获得了平均相对改善29.2%的CHMM基线。
项目成果
期刊论文数量(64)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Noisy Speech recognition Based on Codebook Normalization of Discrete-Mixture HMMs
基于离散混合 HMM 码本归一化的噪声语音识别
- DOI:
- 发表时间:2006
- 期刊:
- 影响因子:0
- 作者:T.Kosaka;M.Katoh;M.Kohda
- 通讯作者:M.Kohda
コードブック適応を用いた離散混合分布型HMMによる講演音声認識
使用离散混合分布 HMM(使用码本自适应)进行讲座语音识别
- DOI:
- 发表时间:2006
- 期刊:
- 影响因子:0
- 作者:山本明祥;熊倉拓哉;加藤正治;小坂哲夫;好田正紀
- 通讯作者:好田正紀
雑音混合出力分布型HMMによる雑音下音声認識のMFCCでの評価
使用噪声混合输出分布式 HMM 通过 MFCC 评估噪声中的语音识别
- DOI:
- 发表时间:2005
- 期刊:
- 影响因子:0
- 作者:小坂哲夫;加藤正治;好田正紀
- 通讯作者:好田正紀
日本語話し言葉コーパスを用いた教師なし適応による講演音声認識の性能改善
使用日语口语语料库通过无监督适应提高讲座语音识别的性能
- DOI:
- 发表时间:2006
- 期刊:
- 影响因子:0
- 作者:R.Tsutsumi;M.Katoh;T.Kosaka;M.Kohda;加藤正治;阿部拓也
- 通讯作者:阿部拓也
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
KOSAKA Tetsuo其他文献
KOSAKA Tetsuo的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('KOSAKA Tetsuo', 18)}}的其他基金
Development of high-accuracy system for recognizing spontaneous speech
高精度自发语音识别系统的开发
- 批准号:
22500144 - 财政年份:2010
- 资助金额:
$ 1.86万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
相似国自然基金
基于MFSD2A调控血迷路屏障跨细胞囊泡转运机制的噪声性听力损失防治研究
- 批准号:82371144
- 批准年份:2023
- 资助金额:49.00 万元
- 项目类别:面上项目
cGAS-STING激活IFN1反应介导噪声性耳蜗损伤机制研究
- 批准号:82371152
- 批准年份:2023
- 资助金额:49.00 万元
- 项目类别:面上项目
新一代超声速客机起降阶段增升装置气动噪声产生机理及控制方法研究(NOISE)
- 批准号:12261131502
- 批准年份:2022
- 资助金额:105.00 万元
- 项目类别:国际(地区)合作与交流项目
介观输运中量子涨落性质的研究
- 批准号:10347003
- 批准年份:2003
- 资助金额:8.0 万元
- 项目类别:专项基金项目
相似海外基金
Aquatic Pollution from Light and Anthropogenic Noise: management of impacts on biodiversity
光和人为噪声造成的水生污染:生物多样性影响管理
- 批准号:
10098417 - 财政年份:2024
- 资助金额:
$ 1.86万 - 项目类别:
EU-Funded
Noise-reduction mechanisms in jet engines: chevrons are the answer
喷气发动机的降噪机制:人字形就是答案
- 批准号:
DE240100933 - 财政年份:2024
- 资助金额:
$ 1.86万 - 项目类别:
Discovery Early Career Researcher Award
Silencing the noise in quantum circuits by a Quantum fluid Bath - SQuBa
通过量子流体浴消除量子电路中的噪声 - SQuBa
- 批准号:
EP/Y022289/1 - 财政年份:2024
- 资助金额:
$ 1.86万 - 项目类别:
Research Grant
Understanding the mechanisms underlying noise-induced damage of hair cell ribbon synapses
了解噪声引起的毛细胞带突触损伤的机制
- 批准号:
BB/Z514743/1 - 财政年份:2024
- 资助金额:
$ 1.86万 - 项目类别:
Fellowship
RII Track-4:@NASA: Wind-induced noise in the prospective seismic data measured in the Venusian surface environment
RII Track-4:@NASA:金星表面环境中测量的预期地震数据中的风致噪声
- 批准号:
2327422 - 财政年份:2024
- 资助金额:
$ 1.86万 - 项目类别:
Standard Grant
CRII: CSR: From Bloom Filters to Noise Reduction Streaming Algorithms
CRII:CSR:从布隆过滤器到降噪流算法
- 批准号:
2348457 - 财政年份:2024
- 资助金额:
$ 1.86万 - 项目类别:
Standard Grant
CAREER: Ultralow phase noise signal generation using Kerr-microresonator optical frequency combs
职业:使用克尔微谐振器光学频率梳生成超低相位噪声信号
- 批准号:
2340973 - 财政年份:2024
- 资助金额:
$ 1.86万 - 项目类别:
Continuing Grant
Ultra-low noise magnetic environments
超低噪声磁场环境
- 批准号:
ST/Y509978/1 - 财政年份:2024
- 资助金额:
$ 1.86万 - 项目类别:
Research Grant
Neural noise in human cognitive ageing and reserve
人类认知衰老和储备中的神经噪声
- 批准号:
FT230100658 - 财政年份:2024
- 资助金额:
$ 1.86万 - 项目类别:
ARC Future Fellowships
Aquatic Pollution from Light and Anthropogenic Noise: management of impacts on biodiversity
光和人为噪声造成的水生污染:生物多样性影响管理
- 批准号:
10107549 - 财政年份:2024
- 资助金额:
$ 1.86万 - 项目类别:
EU-Funded