2次元メルケプストラムの動的特徴とニュ-ラルネットを用いる単語音声認識

使用二维梅尔倒谱和神经网络动态特征的单词语音识别

基本信息

  • 批准号:
    02650243
  • 负责人:
  • 金额:
    $ 1.22万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for General Scientific Research (C)
  • 财政年份:
    1990
  • 资助国家:
    日本
  • 起止时间:
    1990 至 无数据
  • 项目状态:
    已结题

项目摘要

本研究では、音声の認識において重要な役割を果たしている音声のスペクトルの動的特徴を表すことのできる用いて単語音声認識の検討を行った。音声デ-タの学習および認識には、3層構造で学習がバックプロパゲ-ション法によるニュ-ラルネットを用いた。2次元メルケプストラムは分析区間内の音声のスペクトル包絡などの平均的な特徴を表す静的領域と,それらの変化分を表す動的領域にほぼ分割でき,スペクトルの変形にも強いことが明らかになってきた。そこでこれらの特徴領域をニュ-ラルネットにより更に検討し音声認識により有効な領域を活用するため以下のような検討を行った。1.10数字音声による2次元メルケプストラムの特徴領域の検討:少語彙の特定話者,不特定話者の10数字単語音声認識により話者の正規化の問題を検討した。音声スペクトルの時間的に緩やかな動的特徴が有効であることを明らかにし,本方法によれば99.5%以上の認識率が得られることを報告した。2.100単語音声認識による2次元メルケプストラムの特徴領域の検討:大語彙化への問題に対処するため,100単語での特定話者及び不特定話者の単語認識を検討し,1と同様に音声スペクトルの時間的に緩やかな動的特徴の有効性を確認した。本方法により特定話者の場合平均99%の認識率が得られることを報告した。3.パソコン用ニュ-ラルコンピュ-タによる単語認識システムの構成:本研究はデ-タの分析はパソコンにより行ったが,大量のデ-タを高速に学習,認識するため,ニュ-ラルネット専用ボ-ドを購入し,パソコン制御による効率的なシステムを構成することができ,上記1,2の大部分は本システムで実行した。
This study discusses the importance of sound recognition and its application in the study of the characteristics of sound selection. The sound of the sound of the study and understanding of the three-layer structure of the study of the use of 2. The average characteristic of sound envelope in the analysis interval is divided into two parts: static field and dynamic field. This is the first time I've ever seen a person who's been in a relationship with someone who's been in a relationship with someone else. 1.10 Discussion on the characteristic domain of digital voice recognition: special speaker with few words, special speaker with no specific speaker, normalization of digital voice recognition. The recognition rate of this method is more than 99.5%. 2.100 Single Speech Recognition: 2-Dimensional Analysis of Feature Fields: Problems of Large Vocabulary, 100 Single Speech Recognition of Specific Speakers and Non-Specific Speakers, 1 Identification of Slow-motion Features of Same Speech Recognition Time. This method can be used to analyze the situation of special speaker, and the recognition rate is 99% on average. 3. The structure of the system: This study analyzed the structure of the system, and a large number of the system were studied at high speed.

项目成果

期刊论文数量(6)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
KITAMURA: "Speaker Recognition Using Dynamic Features of Speech and a Neural Network" 1990 Proceedings of International Conference on Signal Processing(1990年信号処理国際会議論文集). ICSP'90. 461-464 (1990)
北村:“使用语音动态特征和神经网络进行说话人识别”1990 年国际信号处理会议论文集 461-464 (1990)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
西岡 健: "2次元メルケプストラムとニュ-ラルネットを用いた特定話者100単語認識" 平成2年度電気関係学会東海支部連合大会論文集. 平成2年. 412 (1990)
Ken Nishioka:“使用二维梅尔倒谱和神经网络识别特定说话者的 100 个单词”1990 年电气工程学会东海分会会议记录。1990 年。412 (1990)
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
KITAMURA: "SpeakerーIndependent Word Recognition in Noisy Environments using Dynamic and Averaged Spectral Features Based on A TwoーDimensional MelーCepstrum" 1990 Proceedings of International Conference on Spoken Language Processing(1990年音声言語処理国際会議論文集). ICS
KITAMURA:“使用基于二维梅尔倒谱的动态和平均频谱特征在嘈杂环境中进行与说话人无关的单词识别”1990 年国际口语语言处理会议论文集。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
畑山 和寛: "2次元メルケプストラムとニュ-ラルネットによる話者認識の検討" 日本音響学会春季講演会論文集. 2ー3ー7. 63-64 (1990)
Kazuhiro Hatayama:“使用二维梅尔倒谱和神经网络进行说话人识别的研究”日本声学学会春季会议记录2-3-64(1990)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
伊藤 朝信: "2次元メルケプストラムとニュ-ラルネットを用いた単語音声認識" 電子通信学会ディジタル信号処理研究会資料. DSP89ー40. 9-16 (1990)
Tomonobu Ito:“使用二维梅尔倒谱和神经网络的单词语音识别”IEICE 数字信号处理研究组材料。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

北村 正其他文献

ベイズ的アプローチに基づくHMM音声合成
基于贝叶斯方法的HMM语音合成
声質と歌唱スタイルを自動学習可能な歌声合成システム
歌声合成系统,可自动学习音质和演唱风格
  • DOI:
  • 发表时间:
    2008
  • 期刊:
  • 影响因子:
    0
  • 作者:
    酒向 慎司;才野 慶二郎;南角 吉彦;徳田 恵一;北村 正
  • 通讯作者:
    北村 正
隠れマルコフモデルに基づく指文字動画像生成
基于隐马尔可夫模型的指纹视频生成
  • DOI:
  • 发表时间:
    2005
  • 期刊:
  • 影响因子:
    0
  • 作者:
    森 健史;南角吉彦;宮島千代美;徳田恵一;北村 正
  • 通讯作者:
    北村 正
隠れマルコフモデルに基づいた歌声合成
基于隐马尔可夫模型的歌声合成
HMM音声合成における感情表現のモデル化
HMM 语音合成中的情感表达建模

北村 正的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('北村 正', 18)}}的其他基金

2次元メルケプストラムを利用する騒音下の単語音声認識
使用 2D 梅尔倒谱进行噪声中的单词语音识别
  • 批准号:
    62750285
  • 财政年份:
    1987
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
人間の聴覚特性を考慮した音声の分析合成系による音声の識別と認識
使用考虑人类听觉特征的语音分析和合成系统进行语音识别和识别
  • 批准号:
    58750252
  • 财政年份:
    1983
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
人間の聴覚特性を考慮した音声の分析合成系による音声の特徴抽出と符号化
使用考虑人类听觉特征的语音分析和合成系统进行语音特征提取和编码
  • 批准号:
    57750265
  • 财政年份:
    1982
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)

相似海外基金

多層ニュ-ラルネットによる情報集約機能の基礎的研究
使用多层神经网络的信息聚合函数的基础研究
  • 批准号:
    03251214
  • 财政年份:
    1991
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
ニュ-ラルネットによる化学プロセスの制御
使用神经网络控制化学过程
  • 批准号:
    03650766
  • 财政年份:
    1991
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (C)
多数のカテゴリを学習・識別するニュ-ラルネットCombNETーIIに関する研究
学习和识别多类别的神经网络CombNET-II的研究
  • 批准号:
    03251215
  • 财政年份:
    1991
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
視覚系と同じ特徴に基づく文字認識装置のニュ-ラルネットによる構成の研究
基于与视觉系统相同特性的神经网络构建字符识别装置的研究
  • 批准号:
    03251217
  • 财政年份:
    1991
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
ニュ-ラルネットによるホルタ-心電図記録のデ-タ圧縮に関する研究
基于神经网络的动态心电图记录数据压缩研究
  • 批准号:
    02650300
  • 财政年份:
    1990
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了