劣条件下の混合音響信号の分離とその音声認識への利用
恶劣条件下混合声信号的分离及其在语音识别中的应用
基本信息
- 批准号:06F06099
- 负责人:
- 金额:$ 1.47万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for JSPS Fellows
- 财政年份:2006
- 资助国家:日本
- 起止时间:2006 至 2007
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
混合音響信号の分離、雑音除去、音声分析を中心に以下の成果を達成するとともに、音源分離、雑音除去後の音声認識の予備実験を行い、波形歪みと認識率との関係を調べた。1.2音源2マイクロフォンの場合について、DUETや適応Beam-formingと独立成分分析を行うことにより、マイクロフォン間の距離が2cmと小さい場合にも有効な音源分離手法を開発した。2.音声の無音区間から雑音の種類を推定し、それにより、最適の独立成分分析を行って、音源分離する手法を開発した。3、音声をコサイン変換して得られる係数について雑音の寄与部分を引き算する従来の閾値法において、EMD(Empirical Mode Decomposition)によって信号の周波数を幾つかの帯域に分け、雑音成分の大きな帯域で再度、波形レベルの閾値操作を行う手法を開発し、白色雑音を対象とした実験により、従来手法に対する優位性を示した。4.信号を帯域分割し、帯域ごとに最適次数の線形予測を行う手法があるが、EMDを用いて基本モード成分に分割することにより、従来のWaveletによるものより高い性能(同じ次数でより少ない予測誤差)を得た。5.音声信号をEMDにより分割した後、各成分について自己相関関数を求め、比較することにより、有声/無声の判定を行う手法を開発した。波形のパワー、自己相関等を用いる従来手法と比較して、判定性能に優れることを、実験的に確かめた。6.EMDにより信号を基本モードに分解した上で、基本周波数に対応するモードを選択することにより基本周波数を抽出する手法を開発し、従来法に対する優位性を実験的に示した。
The following results have been achieved through separation of mixed audio signals, noise removal, and sound analysis. The source is separated, the sound is removed, the sound recognition is prepared, the waveform is distorted, the recognition rate is adjusted, and the relationship is adjusted. 1.2 Sound source 2マイクロフォンのoccasionについて, DUETやAdaptationBeam-formingとIndependent component analysis The distance between を行うことにより and マイクロフォンの is 2cm, and it is effective in small さい occasions and the sound source separation technique is を开発した. 2. The silent interval of sound, the type of sound, the estimation, the optimal independent component analysis, the sound source separation technique, and the sound source separation method. 3. Sound をコサイン変change して got られる coefficient について雑音の发与part を cited きcalculation する従来の threshold value method において, EMD (Empirical Mode Decomposition) The number of cycles of the signal, the frequency of the signal, the frequency of the signal, the frequency of the signal, the frequency of the signal, the frequency of the signal, the frequency of the signal, and the frequency of the sound component The operation of the threshold value of the shape is the line of the technique, the technique of opening the hair, the sound of the white sound, the image of the object, and the technique of the appearance, the superiority of the character, and the superiority of the character. 4. Signal domain segmentation, linear prediction of optimal times of domain, line prediction technique, EMD application and basic components The performance of segmented wavelet and wavelet is high (the same number of times and the predicted error is less). 5. After the sound signal is segmented by EMD, each component is related to its own number, compared, and the sound/silent judgment method is used. Use the method of waveform analysis, self-relatedness, etc. to compare, judge performance, and judge the accuracy of the performance. 6. EMD signal decomposition is based on the basic signal, and the basic cycle number is selected. The ることによりbasic cycle number をextraction する technique を开発し, the に対するpredominance を実験's に Show した.
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
A multiband approach for voiced/unvoiced discrimination of speech signals
用于区分语音信号的浊音/清音的多频带方法
- DOI:
- 发表时间:2008
- 期刊:
- 影响因子:0
- 作者:Yong Shao;Kotaro Morita;Qing Dai;Seiichi Nishizawa and Norio Teramae;Md.Khademul Islam Molla
- 通讯作者:Md.Khademul Islam Molla
A speech denoising system based on ICA and voice activity detection
基于ICA和语音活动检测的语音去噪系统
- DOI:
- 发表时间:2008
- 期刊:
- 影响因子:0
- 作者:MOLLA;Md.Khademul Islam;Antonio Rebordao
- 通讯作者:Antonio Rebordao
Pitch estimation of noisy speech signals using empirical mode decomposition
使用经验模式分解进行噪声语音信号的基音估计
- DOI:
- 发表时间:2007
- 期刊:
- 影响因子:0
- 作者:Yong Shao;Kotaro Morita;Qing Dai;Seiichi Nishizawa and Norio Teramae;Md.Khademul Islam Molla;Md.Khademul Islam Molla;Md.Khademul Islam Molla
- 通讯作者:Md.Khademul Islam Molla
Linear Predictive Coding of Speech Signals with Empirical Mode Decomposition
使用经验模态分解的语音信号线性预测编码
- DOI:
- 发表时间:2007
- 期刊:
- 影响因子:0
- 作者:MOLLA;Md.Khademul Islam
- 通讯作者:Md.Khademul Islam
Multiband linear prediction of speech signals with adaptive order using empirical mode decomposition
使用经验模式分解的自适应顺序语音信号的多频带线性预测
- DOI:
- 发表时间:2007
- 期刊:
- 影响因子:0
- 作者:Yong Shao;Kotaro Morita;Qing Dai;Seiichi Nishizawa and Norio Teramae;Md.Khademul Islam Molla;Md.Khademul Islam Molla
- 通讯作者:Md.Khademul Islam Molla
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
広瀬 啓吉其他文献
生成過程モデルに基づく母語話者と中国語話者の日本語朗読音声の基本周波数パターン
基于生成过程模型的母语者和汉语者日语阅读语音的基本频率模式
- DOI:
- 发表时间:
2007 - 期刊:
- 影响因子:0
- 作者:
平野 宏子;広瀬 啓吉;河合 剛;顧文 涛;峯松 信明 - 通讯作者:
峯松 信明
音調核モデルに基づく中国語F_0パターンの2段階生成
基于声调核模型的汉语F_0模式的两步生成
- DOI:
- 发表时间:
2006 - 期刊:
- 影响因子:0
- 作者:
Keikichi Hirose;Yasufumi Asano;Nobuaki Minematsu;Jinfu Ni;Wentao Gu;Keikichi Hirose;Qinghua Sun;Keikichi Hirose;越智景子;Keikichi Hirose;Jinfu Ni;Quinghua Sun;広瀬 啓吉;浅野 泰史;河村 美由紀;孫慶華 - 通讯作者:
孫慶華
基本周波数パターン生成過程モデルのコーパスベースパラメータ自動抽出の評価
基于语料库的基频模式生成过程模型自动参数提取评价
- DOI:
- 发表时间:
2006 - 期刊:
- 影响因子:0
- 作者:
Keikichi Hirose;Yasufumi Asano;Nobuaki Minematsu;Jinfu Ni;Wentao Gu;Keikichi Hirose;Qinghua Sun;Keikichi Hirose;越智景子;Keikichi Hirose;Jinfu Ni;Quinghua Sun;広瀬 啓吉;浅野 泰史;河村 美由紀 - 通讯作者:
河村 美由紀
種々の調子の音声合成のための韻律制御-感情音声合成の視点から-(招待講演)
各种声调语音合成的韵律控制——从情感语音合成的角度——(特邀报告)
- DOI:
- 发表时间:
2006 - 期刊:
- 影响因子:0
- 作者:
Keikichi Hirose;Yasufumi Asano;Nobuaki Minematsu;Jinfu Ni;Wentao Gu;Keikichi Hirose;Qinghua Sun;Keikichi Hirose;越智景子;Keikichi Hirose;Jinfu Ni;Quinghua Sun;広瀬 啓吉 - 通讯作者:
広瀬 啓吉
文節単位での感情の程度を考慮した統計的韻律制御
考虑每个短语的情感程度的统计韵律控制
- DOI:
- 发表时间:
2006 - 期刊:
- 影响因子:0
- 作者:
Keikichi Hirose;Yasufumi Asano;Nobuaki Minematsu;Jinfu Ni;Wentao Gu;Keikichi Hirose;Qinghua Sun;Keikichi Hirose;越智景子;Keikichi Hirose;Jinfu Ni;Quinghua Sun;広瀬 啓吉;浅野 泰史 - 通讯作者:
浅野 泰史
広瀬 啓吉的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('広瀬 啓吉', 18)}}的其他基金
認知モデルと常識ベースに基づく情動を含む音声コミュニケーション
语音通信,包括基于认知模型和常识的情感
- 批准号:
08F08049 - 财政年份:2008
- 资助金额:
$ 1.47万 - 项目类别:
Grant-in-Aid for JSPS Fellows
フィンランド人日本語学習者による日本語語い音調の韻律研究
芬兰日语学习者对日语声调的韵律研究
- 批准号:
06F05756 - 财政年份:2005
- 资助金额:
$ 1.47万 - 项目类别:
Grant-in-Aid for JSPS Fellows
フィンランド人日本語学習者による日本語語い音調の韻律研究
芬兰日语学习者对日语声调的韵律研究
- 批准号:
05F05756 - 财政年份:2005
- 资助金额:
$ 1.47万 - 项目类别:
Grant-in-Aid for JSPS Fellows
文節境界を考慮した統計的言語モデルの高度化と音声認識への利用
推进考虑子句边界及其在语音识别中的使用的统计语言模型
- 批准号:
16650034 - 财政年份:2004
- 资助金额:
$ 1.47万 - 项目类别:
Grant-in-Aid for Exploratory Research
中国語基本周波数パターンの分析、定式化と合成手法の開発
中国基频模式分析、合成方法的制定和发展
- 批准号:
04F04035 - 财政年份:2004
- 资助金额:
$ 1.47万 - 项目类别:
Grant-in-Aid for JSPS Fellows
高品質音声合成のための韻律制御
高质量语音合成的韵律控制
- 批准号:
12132202 - 财政年份:2000
- 资助金额:
$ 1.47万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
韻律に着目した音声言語情報処理の高度化
以韵律为中心的口语信息处理的复杂性
- 批准号:
12132101 - 财政年份:2000
- 资助金额:
$ 1.47万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
モーラ遷移確率モデルによる韻律の表現と音声認識への利用に関する研究
基于mora转移概率模型的韵律表达及其在语音识别中的应用研究
- 批准号:
11878058 - 财政年份:1999
- 资助金额:
$ 1.47万 - 项目类别:
Grant-in-Aid for Exploratory Research
韻律に着目した音声言語情報処理の高度化に関する調査研究
以韵律为中心的口语信息处理进展研究
- 批准号:
10898014 - 财政年份:1998
- 资助金额:
$ 1.47万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
モデルの広がりを考慮した頑健な音声認識手法の研究
考虑模型扩散的鲁棒语音识别方法研究
- 批准号:
09878065 - 财政年份:1997
- 资助金额:
$ 1.47万 - 项目类别:
Grant-in-Aid for Exploratory Research














{{item.name}}会员




