Asynchronous-Transition Hidden Markov Model with State-Tying across Time for Automatic Speech Recognition

用于自动语音识别的具有跨时间状态绑定的异步转移隐马尔可夫模型

基本信息

项目摘要

This project aimed to improve acoustic models for speech recognition systems. The state-of-the-art hidden Markov model (HMM) based acoustic models usually treat the acoustic features as a chain of stationary signal sources. The observed values of these features are represented by vectors. We assumed that they might be better modeled by individual vector components. We discussed two methods based on this assumptionIn the first method, wearied to model asynchronous changes of individual acoustic vector components. Conventional HMM implicitly assumes that individual components change their statistical properties simultaneously. This assumption might be not true. Temporally changing patterns of individual acoustic components do not necessarily synchronize with beach other. We proposed a new HMM that allowed asynchronous state transitions between individual vector components. We demonstrated that this new HMM outperformed the conventional HMM in speaker-dependent speech recognition taskIn the second method, we tried to model phoneme context dependency of individual acoustic vector components. Conventional parameter tying techniques provide a common tying structure for all vector components, no matter how different is their individual components complexity and phoneme context dependency. In this discussion, we proposed a new parameter tying technique that allowed to have distinct tying structures for each component. Our experimental results showed that proposed HMM with feature-depended tying worked better than conventional HMM with a common tying
该项目旨在改进语音识别系统的声学模型。基于隐马尔可夫模型(HMM)的声学模型通常将声学特征视为一系列平稳信号源。这些特征的观测值由向量表示。我们假设它们可能更好地由单个矢量分量建模。在此基础上讨论了两种方法,第一种方法是对单个声矢量分量的异步变化进行建模。传统的HMM隐含地假设各个分量同时改变它们的统计特性。这个假设可能不正确。各个声学分量的时间变化模式不一定与其他海滩同步。我们提出了一种新的HMM,允许异步状态之间的转换个别向量分量。我们证明,这种新的HMM优于传统的HMM在说话人相关的语音识别taskIn第二种方法,我们试图模拟音素上下文依赖的个别声学矢量分量。传统的参数绑定技术为所有矢量分量提供了一个公共的绑定结构,无论它们的各个分量的复杂性和音素上下文依赖性有多么不同。在这次讨论中,我们提出了一个新的参数绑定技术,允许有不同的绑定结构的每个组件。我们的实验结果表明,提出的HMM与特征依赖的搭售工作优于传统的HMM与共同的搭售

项目成果

期刊论文数量(18)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
S.Matsuda, M.Nakai, H.Shimodaira, S.Sagayama: "Generation of phoneme environment clusters with multiple trajectories"The 2001, Autumn Meeting of The Acoustical Society of Japan, (in Japanese). 1-1-10 (Oct). 19-20 (2001)
S.Matsuda、M.Nakai、H.Shimodaira、S.Sagayama:“具有多个轨迹的音素环境簇的生成”,日本声学学会 2001 年秋季会议(日语)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
松田 繁樹: "音素環境クラスタリングを基礎としたマルチパス音響モデルの自動生成"日本音響学会2002年秋季研究発表会講演論文集. 81-82 (2002)
Shigeki Matsuda:“基于音素环境聚类的多路径声学模型的自动生成”日本声学学会 2002 年秋季研究会议论文集 81-82 (2002)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
S.Matsuda, M.Nakai, H.Shimodaira, S.Sagayama: "Feature-dependent Allophone Clustering"Proc.International Conference of Spoken Language Processing (CSLP2000). (Oct). 413-416 (2000)
S.Matsuda、M.Nakai、H.Shimodaira、S.Sagayama:“特征相关的音位变体聚类”Proc.国际口语处理会议(CSLP2000)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
S.Matsuda: "Feature-dependent Allophone Clustering"Proc. International Conference on Spoken Language Processing (IC-SLP2000). 1. 413-416 (2000)
S.Matsuda:“特征相关的变体聚类”Proc。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
松田 繁樹: "複数の特徴ベクトル軌道を持つ環境依存音素クラスタの生成"日本音響学会2001年秋季研究発表会講演論文集. 19-20 (2001)
Shigeki Matsuda:“具有多个特征向量轨迹的环境相关音素簇的生成”日本声学学会 2001 年秋季研究会议记录 19-20 (2001)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

SHIMODAIRA Hiroshi其他文献

SHIMODAIRA Hiroshi的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('SHIMODAIRA Hiroshi', 18)}}的其他基金

Model and example based prosodic feature extraction and its efficient integration for speech recognition along with phoneme-based recognition
基于模型和示例的韵律特征提取及其与基于音素的识别的语音识别的有效集成
  • 批准号:
    08680391
  • 财政年份:
    1996
  • 资助金额:
    $ 2.18万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)

相似国自然基金

基于GMM-HMM的高速动车组牵引系统健康状态诊断研究
  • 批准号:
    2025JJ80335
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
多源异构数据张量补全的HMM协同过滤推荐方法研究
  • 批准号:
    62002381
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
基于多体动力学仿真和HMM的直升机传动系统早期故障诊断与预测维护
  • 批准号:
    U1433118
  • 批准年份:
    2014
  • 资助金额:
    42.0 万元
  • 项目类别:
    联合基金项目
基于AR-HMM的重型车辆侧翻预警模型与算法研究
  • 批准号:
    51205151
  • 批准年份:
    2012
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
基于GA和HMM的鲁棒性话者确认系统
  • 批准号:
    69872036
  • 批准年份:
    1998
  • 资助金额:
    11.2 万元
  • 项目类别:
    面上项目
进化HMM模型理论及ECG信号识别研究
  • 批准号:
    69881001
  • 批准年份:
    1998
  • 资助金额:
    13.0 万元
  • 项目类别:
    专项基金项目
户外运动物体(3-D)识别与姿态理解的HMM
  • 批准号:
    69475005
  • 批准年份:
    1994
  • 资助金额:
    6.0 万元
  • 项目类别:
    面上项目
基于神经网络分类器和HMM的话者自适应连续语音识别
  • 批准号:
    69272035
  • 批准年份:
    1992
  • 资助金额:
    6.0 万元
  • 项目类别:
    面上项目

相似海外基金

Financial modelling in an HMM-modulated regime-switching framework
HMM 调制的制度转换框架中的财务建模
  • 批准号:
    341780-2012
  • 财政年份:
    2016
  • 资助金额:
    $ 2.18万
  • 项目类别:
    Discovery Grants Program - Individual
Speech synthesis based on articulatory movement HMM and LSP digital filter
基于发音运动HMM和LSP数字滤波器的语音合成
  • 批准号:
    16K00234
  • 财政年份:
    2016
  • 资助金额:
    $ 2.18万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Maximising the commercial impact of (meta-)genomics via bespoke HMM and big data tools
通过定制 HMM 和大数据工具最大化(元)基因组学的商业影响
  • 批准号:
    132161
  • 财政年份:
    2016
  • 资助金额:
    $ 2.18万
  • 项目类别:
    Feasibility Studies
Financial modelling in an HMM-modulated regime-switching framework
HMM 调制的制度转换框架中的财务建模
  • 批准号:
    341780-2012
  • 财政年份:
    2015
  • 资助金额:
    $ 2.18万
  • 项目类别:
    Discovery Grants Program - Individual
Voice-pathology analysis based on automatic topology generation of glottal source HMM
基于声门源HMM自动拓扑生成的语音病理分析
  • 批准号:
    26330216
  • 财政年份:
    2014
  • 资助金额:
    $ 2.18万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Financial modelling in an HMM-modulated regime-switching framework
HMM 调制的制度转换框架中的财务建模
  • 批准号:
    341780-2012
  • 财政年份:
    2014
  • 资助金额:
    $ 2.18万
  • 项目类别:
    Discovery Grants Program - Individual
Financial modelling in an HMM-modulated regime-switching framework
HMM 调制的制度转换框架中的财务建模
  • 批准号:
    341780-2012
  • 财政年份:
    2013
  • 资助金额:
    $ 2.18万
  • 项目类别:
    Discovery Grants Program - Individual
Financial modelling in an HMM-modulated regime-switching framework
HMM 调制的制度转换框架中的财务建模
  • 批准号:
    341780-2012
  • 财政年份:
    2012
  • 资助金额:
    $ 2.18万
  • 项目类别:
    Discovery Grants Program - Individual
ベイズ基準によるHMMに基づく音声合成における動的なパラメータ共有構造選択
使用贝叶斯准则的基于 HMM 的语音合成中的动态参数共享结构选择
  • 批准号:
    10J10062
  • 财政年份:
    2010
  • 资助金额:
    $ 2.18万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
Uncorporating news HMM approaches into transmembrane analysis
结合新闻 HMM 进行跨膜分析
  • 批准号:
    353675-2007
  • 财政年份:
    2007
  • 资助金额:
    $ 2.18万
  • 项目类别:
    University Undergraduate Student Research Awards
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了