权益分类	功能权益	普通用户	{{item.name}}会员
{{category.name}}	{{benefitItem.name}}

雑音環境下における音声の対数スペクトル推定と耐雑音性音声認識への応用

噪声环境下语音的对数谱估计及其在耐噪语音识别中的应用

基本信息

批准号：
04650277
负责人：
小林隆夫
金额：
$ 1.28万
依托单位：
Tokyo Institute of Technology
依托单位国家：
日本
项目类别：
Grant-in-Aid for General Scientific Research (C)
财政年份：
1992
资助国家：
日本
起止时间：
1992 至无数据
项目状态：
已结题

项目摘要

本研究の目的は,背景雑音が存在する環境で観測された音声信号に対し,雑音成分の影響を除去した音声信号の対数スペクトルを推定する新たな手法を確立し,さらに,提案手法を雑音環境下での単語音声認識における認識パラメータ推定法として応用した際の有効性を検討することにあった.まず,音声信号を表わすスペクトルモデルとして,ケプストラムをパラメータとする指数関数型の最小位相モデルを仮定し,これに事後確率最大法を適用してパラメータ推定の定式化を行った.その結果,提案するスペクトル推定法がウィナーフィルタリングと対数スペクトルの不偏推定法の繰り返しに帰着されることを示し,その処理アルゴリズムを確立した.また,一般化ケプストラムモデルへの拡張に関しても考察を行った.さらに,前述のアルゴリズムをワークステーション上の処理システムとして実現し,雑音を付加した音声信号を用いて音声強調実験を行った.雑音として白色雑音を用いた場合,従来の全極モデルに基づく手法と比較して,無声子音部で強調音声のSN比が向上すること,強調音声の聴取試験結果ではミュージカルノイズが減少すること等の事実を明かにした.次に,提案する手法の応用として,得られたケプストラムを認識パラメータに用い,雑音を付加した単語音声を対象とした音声認識実験を行った.男女各1名の特定話者による100都市名の認識結果では,従来の全極モデルに基づく手法に比較して,SN比が-5〜20dBの広い範囲で認識率が向上することが確かめられた.

The purpose of this study is to establish a new method for estimating the number of acoustic signals detected in the presence of background noise, and to propose a method for estimating the number of acoustic signals detected in the presence of background noise. The minimum phase of the exponential correlation model is determined by the method of maximum accuracy after the event. As a result, it is proposed that the estimation method of the non-biased estimation method be established. The general purpose of this paper is to investigate the relationship between the two. In addition, the aforementioned audio and video processing system is implemented in the audio and video signal processing system. When white sound is used, the sound from all poles is compared with the SN ratio of the accent sound. The SN ratio of the accent sound is increased. The test result of the accent sound is decreased. In addition, the method of speech recognition can be used to improve the quality of speech. The recognition rate of 100 city names among 1 male and 1 female speaker was-5 20dB.

项目成果

期刊论文数量（8）

专著数量（0）

科研奖励数量（0）

会议论文数量（0）

专利数量（0）

菅野俊夫: "一般化ケプストラムモデルに基づく雑音環境下の音声のスペクトル推定" 日本音響学会平成5年度春季研究発表会講演論文集. 1. 261-262 (1993)

Toshio Kanno：“基于广义倒谱模型的噪声环境中的语音频谱估计”日本声学学会 1993 年春季会议记录 1. 261-262 (1993)。

DOI：
发表时间：
期刊：
影响因子：
0
作者：
通讯作者：

菅野俊夫: "Speech Enhancement Using Generalize Cepstral Model" 第7回ディジタル信号処理シンポジウム講演論文集. 85-90 (1992)

Toshio Kanno：“使用广义倒谱模型进行语音增强”第七届数字信号处理研讨会论文集 85-90 (1992)。

DOI：
发表时间：
期刊：
影响因子：
0
作者：
通讯作者：

菅野俊夫: "雑音環境下における音声の対数スペクトル推定" 日本音響学会平成4年度秋季研究発表会講演論文集. 1. 301-302 (1992)

Toshio Kanno：“估计噪声环境中语音的对数频谱”日本声学学会 1992 年秋季会议记录 1. 301-302 (1992)。

DOI：
发表时间：
期刊：
影响因子：
0
作者：
通讯作者：

小林隆夫: "雑音が付加された音声の対数スペクトル推定" 1992年電子情報通信学会秋季大会講演論文集. 1. 110-110 (1992)

Takao Kobayashi：“估计添加噪声的语音的对数频谱”1992 年 IEICE 秋季会议记录 1. 110-110 (1992)。

DOI：
发表时间：
期刊：
影响因子：
0
作者：
通讯作者：

DOI：
{{ item.doi }}
发表时间：
{{ item.publish_year }}
期刊：
{{ item.journal_name }}
影响因子：
{{ item.factor }}
作者：
{{ item.authors }}
通讯作者：
{{ item.author }}

数据更新时间：{{ journalArticles.updateTime }}

作者：
{{ item.author }}

数据更新时间：{{ monograph.updateTime }}

作者：
{{ item.author }}

数据更新时间：{{ sciAawards.updateTime }}

作者：
{{ item.author }}

数据更新时间：{{ conferencePapers.updateTime }}

作者：
{{ item.author }}

数据更新时间：{{ patent.updateTime }}

小林隆夫其他文献

A comparative study of style adaptation algorithms for expressive speech synthesis

表达语音合成风格适应算法的比较研究

DOI：
发表时间：
2005
期刊：
Proc.the 2005 Autumn Meeting of the Acoustical Society of Japan
影响因子：
0
作者：
Makoto Tachibana;Katsumi Ogata;Junichi Yamagishi;Yuji Nakano;Makoto Tachibana;緒方克海;山岸順一;中野雄資;Junichi Yamagishi;Makoto Tachibana;Junichi Yamagishi;Dhany Arifianto;Juri Isogai;Makoto Tachibana;磯貝朱里;橘誠;山岸順一;磯貝朱里;橘誠;野村大輔;中野雄資;能勢隆;橘誠;磯貝朱里;小林隆夫;Junichi Yamagishi;Makoto Tachibana;Junichi Yamagishi;Dhany Arifianto;Juri Isogai;Makoto Tachibana;Juri Isogai;Makoto Tachibana;Junichi Yamagishi;Juri Isogai;Makoto Tachibana;Daisuke Nomura;Yuji Nakano;Takashi Nose;Makoto Tachibana
通讯作者：
Makoto Tachibana

HMM音声合成における対数正規分布による状態継続長のモデル化の検討

HMM语音合成中使用对数正态分布建模状态持续时间长度的研究

DOI：
发表时间：
2004
期刊：
日本音響学会2004年春季研究発表会講演論文集 I
影响因子：
0
作者：
Makoto Tachibana;Katsumi Ogata;Junichi Yamagishi;Yuji Nakano;Makoto Tachibana;緒方克海;山岸順一;中野雄資;Junichi Yamagishi;Makoto Tachibana;Junichi Yamagishi;Dhany Arifianto;Juri Isogai;Makoto Tachibana;磯貝朱里;橘誠;山岸順一;磯貝朱里;橘誠;野村大輔;中野雄資;能勢隆;橘誠;磯貝朱里;小林隆夫;Junichi Yamagishi;Makoto Tachibana;Junichi Yamagishi;Dhany Arifianto;Juri Isogai;Makoto Tachibana;Juri Isogai;Makoto Tachibana;Junichi Yamagishi;Juri Isogai;Makoto Tachibana;Daisuke Nomura;Yuji Nakano;Takashi Nose;Makoto Tachibana;Juri Isogai;Takao Kobayashi;Junichi Yamagishi;Dhany Arifianto;Juri Isogai;Makoto Tachibana;磯貝朱里;小林隆夫;磯貝朱里;中野雄資;川島啓吾;山岸順一;磯貝朱里;橘誠;野村大輔;Dhany Arifianto;Junichi Yamagishi;Makoto Tachibana;Junichi Yamagishi;Junichi Yamagishi;Heiga Zen;Keisuke Miyanaga;宮永圭介;尾関創;山岸順一;全炳河;山岸順一
通讯作者：
山岸順一

HMM音声合成における異なる発話スタイルへの適応の検討

HMM语音合成中对不同语音风格的适应检验

DOI：
发表时间：
2003
期刊：
日本音響学会2004年秋季研究発表会講演文集 I
影响因子：
0
作者：
Makoto Tachibana;Katsumi Ogata;Junichi Yamagishi;Yuji Nakano;Makoto Tachibana;緒方克海;山岸順一;中野雄資;Junichi Yamagishi;Makoto Tachibana;Junichi Yamagishi;Dhany Arifianto;Juri Isogai;Makoto Tachibana;磯貝朱里;橘誠;山岸順一;磯貝朱里;橘誠;野村大輔;中野雄資;能勢隆;橘誠;磯貝朱里;小林隆夫;Junichi Yamagishi;Makoto Tachibana;Junichi Yamagishi;Dhany Arifianto;Juri Isogai;Makoto Tachibana;Juri Isogai;Makoto Tachibana;Junichi Yamagishi;Juri Isogai;Makoto Tachibana;Daisuke Nomura;Yuji Nakano;Takashi Nose;Makoto Tachibana;Juri Isogai;Takao Kobayashi;Junichi Yamagishi;Dhany Arifianto;Juri Isogai;Makoto Tachibana;磯貝朱里;小林隆夫;磯貝朱里;中野雄資;川島啓吾;山岸順一;磯貝朱里;橘誠;野村大輔;Dhany Arifianto;Junichi Yamagishi;Makoto Tachibana;Junichi Yamagishi;Junichi Yamagishi;Heiga Zen;Keisuke Miyanaga;宮永圭介;尾関創;山岸順一;全炳河;山岸順一;橘誠;参納大樹;尾関創;山岸順一;橘誠;Dhany Arifianto;Junichi Yamagishi;Makoto Tachibana;Junichi Yamagishi;Junichi Yamagishi;Heiga Zen;Keisuke Miyanaga;Hajime Ozeki;Junichi Yamagishi;Heiga Zen;Junichi Yamagishi;Maokoto Tachibana;Daiki Sannou;Hajime Ozeki;Junichi Yamagishi;Makoto Tachibana;Takao Kobayashi;小林隆夫;Junichi Yamagishi;Heiga Zen;Keisuke Miyanaga;Makoto Tachibana;山岸順一;宮永圭介;尾関創;山岸順一;橘誠;Junichi Yamagishi;Junichi Yamagishi;Dhany Arifianto;Junichi Yamagishi;Dhany Arifianto;広畑誠;山岸順一;橘誠;益子貴史;山岸順一;橘誠
通讯作者：
橘誠