雑音環境下における音声の対数スペクトル推定と耐雑音性音声認識への応用
噪声环境下语音的对数谱估计及其在耐噪语音识别中的应用
基本信息
- 批准号:04650277
- 负责人:
- 金额:$ 1.28万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for General Scientific Research (C)
- 财政年份:1992
- 资助国家:日本
- 起止时间:1992 至 无数据
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
本研究の目的は,背景雑音が存在する環境で観測された音声信号に対し,雑音成分の影響を除去した音声信号の対数スペクトルを推定する新たな手法を確立し,さらに,提案手法を雑音環境下での単語音声認識における認識パラメータ推定法として応用した際の有効性を検討することにあった.まず,音声信号を表わすスペクトルモデルとして,ケプストラムをパラメータとする指数関数型の最小位相モデルを仮定し,これに事後確率最大法を適用してパラメータ推定の定式化を行った.その結果,提案するスペクトル推定法がウィナーフィルタリングと対数スペクトルの不偏推定法の繰り返しに帰着されることを示し,その処理アルゴリズムを確立した.また,一般化ケプストラムモデルへの拡張に関しても考察を行った.さらに,前述のアルゴリズムをワークステーション上の処理システムとして実現し,雑音を付加した音声信号を用いて音声強調実験を行った.雑音として白色雑音を用いた場合,従来の全極モデルに基づく手法と比較して,無声子音部で強調音声のSN比が向上すること,強調音声の聴取試験結果ではミュージカルノイズが減少すること等の事実を明かにした.次に,提案する手法の応用として,得られたケプストラムを認識パラメータに用い,雑音を付加した単語音声を対象とした音声認識実験を行った.男女各1名の特定話者による100都市名の認識結果では,従来の全極モデルに基づく手法に比較して,SN比が-5〜20dBの広い範囲で認識率が向上することが確かめられた.
The purpose of this study is to establish a new method for estimating the number of acoustic signals detected in the presence of background noise, and to propose a method for estimating the number of acoustic signals detected in the presence of background noise. The minimum phase of the exponential correlation model is determined by the method of maximum accuracy after the event. As a result, it is proposed that the estimation method of the non-biased estimation method be established. The general purpose of this paper is to investigate the relationship between the two. In addition, the aforementioned audio and video processing system is implemented in the audio and video signal processing system. When white sound is used, the sound from all poles is compared with the SN ratio of the accent sound. The SN ratio of the accent sound is increased. The test result of the accent sound is decreased. In addition, the method of speech recognition can be used to improve the quality of speech. The recognition rate of 100 city names among 1 male and 1 female speaker was-5 20dB.
项目成果
期刊论文数量(8)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
菅野 俊夫: "一般化ケプストラムモデルに基づく雑音環境下の音声のスペクトル推定" 日本音響学会平成5年度春季研究発表会講演論文集. 1. 261-262 (1993)
Toshio Kanno:“基于广义倒谱模型的噪声环境中的语音频谱估计”日本声学学会 1993 年春季会议记录 1. 261-262 (1993)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
菅野 俊夫: "Speech Enhancement Using Generalize Cepstral Model" 第7回ディジタル信号処理シンポジウム講演論文集. 85-90 (1992)
Toshio Kanno:“使用广义倒谱模型进行语音增强”第七届数字信号处理研讨会论文集 85-90 (1992)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
菅野 俊夫: "雑音環境下における音声の対数スペクトル推定" 日本音響学会平成4年度秋季研究発表会講演論文集. 1. 301-302 (1992)
Toshio Kanno:“估计噪声环境中语音的对数频谱”日本声学学会 1992 年秋季会议记录 1. 301-302 (1992)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
小林 隆夫: "雑音が付加された音声の対数スペクトル推定" 1992年電子情報通信学会秋季大会講演論文集. 1. 110-110 (1992)
Takao Kobayashi:“估计添加噪声的语音的对数频谱”1992 年 IEICE 秋季会议记录 1. 110-110 (1992)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
小林 隆夫其他文献
A comparative study of style adaptation algorithms for expressive speech synthesis
表达语音合成风格适应算法的比较研究
- DOI:
- 发表时间:
2005 - 期刊:
- 影响因子:0
- 作者:
Makoto Tachibana;Katsumi Ogata;Junichi Yamagishi;Yuji Nakano;Makoto Tachibana;緒方克海;山岸順一;中野雄資;Junichi Yamagishi;Makoto Tachibana;Junichi Yamagishi;Dhany Arifianto;Juri Isogai;Makoto Tachibana;磯貝 朱里;橘 誠;山岸 順一;磯貝 朱里;橘 誠;野村 大輔;中野 雄資;能勢 隆;橘 誠;磯貝 朱里;小林 隆夫;Junichi Yamagishi;Makoto Tachibana;Junichi Yamagishi;Dhany Arifianto;Juri Isogai;Makoto Tachibana;Juri Isogai;Makoto Tachibana;Junichi Yamagishi;Juri Isogai;Makoto Tachibana;Daisuke Nomura;Yuji Nakano;Takashi Nose;Makoto Tachibana - 通讯作者:
Makoto Tachibana
HMM音声合成における対数正規分布による状態継続長のモデル化の検討
HMM语音合成中使用对数正态分布建模状态持续时间长度的研究
- DOI:
- 发表时间:
2004 - 期刊:
- 影响因子:0
- 作者:
Makoto Tachibana;Katsumi Ogata;Junichi Yamagishi;Yuji Nakano;Makoto Tachibana;緒方克海;山岸順一;中野雄資;Junichi Yamagishi;Makoto Tachibana;Junichi Yamagishi;Dhany Arifianto;Juri Isogai;Makoto Tachibana;磯貝 朱里;橘 誠;山岸 順一;磯貝 朱里;橘 誠;野村 大輔;中野 雄資;能勢 隆;橘 誠;磯貝 朱里;小林 隆夫;Junichi Yamagishi;Makoto Tachibana;Junichi Yamagishi;Dhany Arifianto;Juri Isogai;Makoto Tachibana;Juri Isogai;Makoto Tachibana;Junichi Yamagishi;Juri Isogai;Makoto Tachibana;Daisuke Nomura;Yuji Nakano;Takashi Nose;Makoto Tachibana;Juri Isogai;Takao Kobayashi;Junichi Yamagishi;Dhany Arifianto;Juri Isogai;Makoto Tachibana;磯貝朱里;小林隆夫;磯貝朱里;中野雄資;川島啓吾;山岸順一;磯貝朱里;橘 誠;野村大輔;Dhany Arifianto;Junichi Yamagishi;Makoto Tachibana;Junichi Yamagishi;Junichi Yamagishi;Heiga Zen;Keisuke Miyanaga;宮永 圭介;尾関 創;山岸 順一;全 炳河;山岸 順一 - 通讯作者:
山岸 順一
HMM音声合成における異なる発話スタイルへの適応の検討
HMM语音合成中对不同语音风格的适应检验
- DOI:
- 发表时间:
2003 - 期刊:
- 影响因子:0
- 作者:
Makoto Tachibana;Katsumi Ogata;Junichi Yamagishi;Yuji Nakano;Makoto Tachibana;緒方克海;山岸順一;中野雄資;Junichi Yamagishi;Makoto Tachibana;Junichi Yamagishi;Dhany Arifianto;Juri Isogai;Makoto Tachibana;磯貝 朱里;橘 誠;山岸 順一;磯貝 朱里;橘 誠;野村 大輔;中野 雄資;能勢 隆;橘 誠;磯貝 朱里;小林 隆夫;Junichi Yamagishi;Makoto Tachibana;Junichi Yamagishi;Dhany Arifianto;Juri Isogai;Makoto Tachibana;Juri Isogai;Makoto Tachibana;Junichi Yamagishi;Juri Isogai;Makoto Tachibana;Daisuke Nomura;Yuji Nakano;Takashi Nose;Makoto Tachibana;Juri Isogai;Takao Kobayashi;Junichi Yamagishi;Dhany Arifianto;Juri Isogai;Makoto Tachibana;磯貝朱里;小林隆夫;磯貝朱里;中野雄資;川島啓吾;山岸順一;磯貝朱里;橘 誠;野村大輔;Dhany Arifianto;Junichi Yamagishi;Makoto Tachibana;Junichi Yamagishi;Junichi Yamagishi;Heiga Zen;Keisuke Miyanaga;宮永 圭介;尾関 創;山岸 順一;全 炳河;山岸 順一;橘 誠;参納 大樹;尾関 創;山岸 順一;橘 誠;Dhany Arifianto;Junichi Yamagishi;Makoto Tachibana;Junichi Yamagishi;Junichi Yamagishi;Heiga Zen;Keisuke Miyanaga;Hajime Ozeki;Junichi Yamagishi;Heiga Zen;Junichi Yamagishi;Maokoto Tachibana;Daiki Sannou;Hajime Ozeki;Junichi Yamagishi;Makoto Tachibana;Takao Kobayashi;小林隆夫;Junichi Yamagishi;Heiga Zen;Keisuke Miyanaga;Makoto Tachibana;山岸順一;宮永圭介;尾関 創;山岸順一;橘 誠;Junichi Yamagishi;Junichi Yamagishi;Dhany Arifianto;Junichi Yamagishi;Dhany Arifianto;広畑誠;山岸 順一;橘 誠;益子 貴史;山岸 順一;橘 誠 - 通讯作者:
橘 誠
小林 隆夫的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('小林 隆夫', 18)}}的其他基金
インタラクティブバーチャルアクター実現のための概念表現からの動作・音声生成
从概念表示生成运动/声音以实现交互式虚拟演员
- 批准号:
17650046 - 财政年份:2005
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Exploratory Research
平均声に基づく多様な声質・発話スタイルが可能な音声インタラクションシステム
基于平均语音的多种语音质量和说话方式的语音交互系统
- 批准号:
13878070 - 财政年份:2001
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Exploratory Research
インタラクションシステムのためのバイモーダル音声合成
交互系统的双模态语音合成
- 批准号:
11878064 - 财政年份:1999
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Exploratory Research
ウェーブレットケプストラム -新しいスペクトル表現パラメーター
小波倒谱 - 新的谱表示参数
- 批准号:
08875076 - 财政年份:1996
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Exploratory Research
複素領域の微分方程式の研究
复域微分方程研究
- 批准号:
03640186 - 财政年份:1991
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for General Scientific Research (C)
マイクロ・コンピュータによる中学校理科における教材や教具のデータ・ベース化
利用微机建立初中科学教材和工具数据库
- 批准号:
63908020 - 财政年份:1988
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (B)
一対の破壊面の三次元数値解析による破壊機構解明法の発展と自動解析装置の開発
开发基于一对断裂面的三维数值分析的断裂机理解析方法及自动分析装置的开发
- 批准号:
62420057 - 财政年份:1987
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for General Scientific Research (A)
複素対数周波数特性近似ディジタルフィルタの研究
逼近复对数频率特性的数字滤波器研究
- 批准号:
62750279 - 财政年份:1987
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
ワーク・シート学習を支援する教材や教具のパッケージ化について
关于支持作业单学习的教材和工具的包装
- 批准号:
60908016 - 财政年份:1985
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (B)
一般化ケプストラムによる合成音声の高品質化の研究
利用广义倒谱提高合成语音质量的研究
- 批准号:
59750242 - 财政年份:1984
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
相似海外基金
粗ぞう性嗄声における音響学的多様性とその発声機構の解明
声音嘶哑的声学多样性及其发声机制的阐明
- 批准号:
21K16842 - 财政年份:2021
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
Sound event detection method capable of analyzing any environmental sound
能够分析任何环境声音的声音事件检测方法
- 批准号:
19K20304 - 财政年份:2019
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
Development of a Prevention Program for School Teacher's Vocal Fatigue
学校教师声乐疲劳预防计划的制定
- 批准号:
19K11302 - 财政年份:2019
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
電磁超音波共鳴法を用いた炭素鋼配管減肉測定に関する研究
电磁超声谐振法碳钢管减薄测量研究
- 批准号:
18J11863 - 财政年份:2018
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for JSPS Fellows
An algorithm of cough pattern of COPD patients using mel-capstrum analysis
基于 Mel-capstrum 分析的 COPD 患者咳嗽模式算法
- 批准号:
26560305 - 财政年份:2014
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Challenging Exploratory Research
Structural health monitoring without utilizing any test signals
无需使用任何测试信号即可进行结构健康监测
- 批准号:
24760477 - 财政年份:2012
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Young Scientists (B)
Estimation of dynamics in a subsurface fracture reservoir by means of proximity microseismic doublets analysis
通过邻近微震双峰分析估计地下裂缝储层的动力学
- 批准号:
20560753 - 财政年份:2008
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Development research on e-learning material helping acquiring English rhythm and sound changes
帮助掌握英语节奏和声音变化的电子学习材料开发研究
- 批准号:
20520526 - 财政年份:2008
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
実世界環境下における遠隔発話の音声認識と話者認識およびインデックス化に関する研究
现实环境中的语音识别、说话人识别和远程语音索引研究
- 批准号:
19650040 - 财政年份:2007
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Challenging Exploratory Research