変調伝達関数に基づいた骨導音声の明瞭度回復法の基礎検討
基于调制传递函数的骨导语音清晰度恢复方法基础研究
基本信息
- 批准号:17650048
- 负责人:
- 金额:$ 1.41万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Exploratory Research
- 财政年份:2005
- 资助国家:日本
- 起止时间:2005 至 2006
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
本研究では,高騒音環境下での音声会話を実現するために骨導マイクを利用した補聴システムの構築を目指している.骨導マイクは雑音に頑健に音声を集音することができるが,その音声の音質や明瞭度は著しく低下しているため,そのままでは利用することができない.そこで,気導音声を入力,骨導音声を出力とした伝達系を想定し,この伝達特性を明らかにするとともに,伝達特性の逆特性を利用した骨導音声の明瞭度回復法の可能性を探る.本年度は,昨年度提案したプロトタイプモデルの改良を行うとともに,提案モデルについて二つの評価検討を行った.1)骨導音声回復法の改良線形予測(LP)法に基づいたプロトタイプモデルについて,骨導音声と気導音声間でLP残差がほぼ一定であること,LP係数を逆推定可能であること,ならびにより安定なLP表現上のLSF係数を逆推定可能であることを利用して,モデルを改良し,完全なたブラインド回復法を提案した.逆推定にはニューラルネットワーク等の学習法を利用した.2)客観評価による検討提案モデルを定量的に評価するために,昨年度構築した骨導・気導音声を評価データとして利用した.客観評価尺度としてスペクトル歪,LPC距離,MFCC距離を利用し,LP法ならびにLPベースのブラインド回復法が有効に骨導音声を気導音声並みに回復できることを示した.この成果は骨導音声に対する音声認識の前処理として利用可能であることを実証している.3)主観評価による検討同じく主観評価として,MOSテスト,改良Rhymeテスト,単語了解度試験を行った.改良Rhymeテストでは英語音声データに対してのみ,単語了解度試験では日本語音声データに対してのみ,MOSテストでは両データに対して行った.その結果,提案法が観測した骨導音声のみから,いずれも骨導音声の低下した音質や音声明瞭度を著しく改善できることを示した.
在这项研究中,我们旨在使用骨传导麦克风建立助听器系统,以在高噪声环境中实现语音对话。尽管骨导电的麦克风可以牢固地收集声音为噪声,但是声音的声音质量和清晰度大大降低,因此无法按原样使用。因此,我们假设使用空气传导音频作为输入并输出骨导向音频的传输系统,并且有可能使用传输特性的反向特征来阐明这种传输特性并恢复骨导向音频的清晰度。探索意义。 This year, we improved the prototype model proposed last year, and conducted two evaluations on the proposed model.1) For a prototype model based on the improved linear prediction (LP) method of bone conduction speech recovery method, we have improved the model and used the fact that the LP residual is almost constant between bone conduction speech and air conduction speech, that the LP coefficient can be inversely estimated, and that the LSF coefficient on a more stable LP表示可以取代估计,并且可以对模型进行成反比。我们提出了一种学习方法,例如用于反向估计的神经网络。2)为了定量评估客观评估提出的模型,我们使用了去年构建的骨传导和空气传导语音作为评估数据。我们使用光谱失真,LPC距离和MFCC距离作为客观评估量表,并表明LP方法和基于LP的盲恢复方法可以有效地将骨传导语音恢复到与空气传导语音相同的水平。该结果可用于预处理骨传导语音的语音识别。 3)基于主观评估的检查:MOS测试,改进的押韵测试和单词清晰度测试也作为主观评估进行。在改进的押韵测试中,仅执行英语语音数据,在清晰度测试一词中,仅执行日本语音数据,在MOS测试中,进行了两个数据。结果,结果表明,从所提出的方法观察到的骨传导语音中,这两种骨传导语音都可以显着提高骨导电语音的声音质量和语音清晰度的降低。
项目成果
期刊论文数量(3)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
A study on restoration of bone-conducted speech with the LPC-based model
基于LPC模型的骨导语音恢复研究
- DOI:
- 发表时间:2006
- 期刊:
- 影响因子:0
- 作者:T.T.Vu;M.Unoki;M.Akagi
- 通讯作者:M.Akagi
A study on an LPC-based restoration model for improving the voice-quality of bone-conducted speech
基于LPC的骨导语音音质恢复模型研究
- DOI:
- 发表时间:2006
- 期刊:
- 影响因子:0
- 作者:T.T.Vu;M.Unoki;M.Akagi
- 通讯作者:M.Akagi
A method for restoring bone-conducted speech based on the LPC model
一种基于LPC模型的骨导语音恢复方法
- DOI:
- 发表时间:2006
- 期刊:
- 影响因子:0
- 作者:T.T.Vu;M.Unoki;M.Akagi
- 通讯作者:M.Akagi
An LP-based Blind Restoration Method for Improving Intelligibility of Bone-conducted Speech
基于LP的提高骨导语音清晰度的盲恢复方法
- DOI:
- 发表时间:2007
- 期刊:
- 影响因子:0
- 作者:Vu;T.T.;Unoki;M.;Akagi;M.
- 通讯作者:M.
A Study on Restoration of Bone-conducted speech with MTF-based and LP-based Models
基于MTF和LP模型的骨导语音恢复研究
- DOI:
- 发表时间:2006
- 期刊:
- 影响因子:0
- 作者:Vu;T.T.;Kimura;K.;Unoki;M.;Akagi;M
- 通讯作者:M
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
鵜木 祐史其他文献
Internal logic viewed from observation space: Theory and a case study
从观察空间看内部逻辑:理论与案例研究
- DOI:
- 发表时间:
2007 - 期刊:
- 影响因子:0
- 作者:
羽二 生篤;鵜木 祐史;赤木 正人;M. Hatakeyama - 通讯作者:
M. Hatakeyama
Controlling engine data : Nonperiodic fluctuations in a spark ignition engine of motorcycle and its stabilization
控制发动机数据:摩托车火花点火发动机的非周期性波动及其稳定性
- DOI:
- 发表时间:
2006 - 期刊:
- 影响因子:0
- 作者:
羽二 生篤;鵜木 祐史;赤木 正人;M. Hatakeyama;Kazuhiro Matsumoto;I. Tsuda;Y. Fukushima;伊藤孝男;Y.Yamaguti;K.Matsumoto - 通讯作者:
K.Matsumoto
脳の中のカオス
大脑混乱
- DOI:
- 发表时间:
2006 - 期刊:
- 影响因子:0
- 作者:
羽二 生篤;鵜木 祐史;赤木 正人;M. Hatakeyama;Kazuhiro Matsumoto;I. Tsuda;Y. Fukushima;伊藤孝男;Y.Yamaguti;K.Matsumoto;S.Tadokoro;津田一郎 - 通讯作者:
津田一郎
Chaos Reality in the Brain
大脑中的混沌现实
- DOI:
- 发表时间:
2007 - 期刊:
- 影响因子:0
- 作者:
羽二 生篤;鵜木 祐史;赤木 正人;M. Hatakeyama;Kazuhiro Matsumoto;I. Tsuda - 通讯作者:
I. Tsuda
鵜木 祐史的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('鵜木 祐史', 18)}}的其他基金
振幅変調知覚に基づく聴覚エンリッチメント:人工内耳用音声信号処理の研究
基于调幅感知的听觉丰富:人工耳蜗音频信号处理研究
- 批准号:
23K21679 - 财政年份:2024
- 资助金额:
$ 1.41万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
Voice information-hiding/anonymization technology for voice privacy protection
语音信息隐藏/匿名化技术,保护语音隐私
- 批准号:
23K18491 - 财政年份:2023
- 资助金额:
$ 1.41万 - 项目类别:
Grant-in-Aid for Challenging Research (Exploratory)
Auditory Enrichment based on perception of amplitude modulation: Study on speech signal processing for Cochlear Implant
基于幅度调制感知的听觉丰富:人工耳蜗语音信号处理研究
- 批准号:
21H03463 - 财政年份:2021
- 资助金额:
$ 1.41万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
VOICE 2.0: towards augmentation of enriched speech communication
VOICE 2.0:增强丰富的语音通信
- 批准号:
20KK0233 - 财政年份:2020
- 资助金额:
$ 1.41万 - 项目类别:
Fund for the Promotion of Joint International Research (Fostering Joint International Research (B))
蝸牛遅延特性を利用した音信号への情報ハイディング
利用耳蜗延迟特性将信息隐藏到声音信号中
- 批准号:
21650035 - 财政年份:2009
- 资助金额:
$ 1.41万 - 项目类别:
Grant-in-Aid for Challenging Exploratory Research
雑音・残響環境下における基本周波数推定法に関する研究
噪声/混响环境下基频估计方法研究
- 批准号:
14780267 - 财政年份:2002
- 资助金额:
$ 1.41万 - 项目类别:
Grant-in-Aid for Young Scientists (B)
音の分離・抽出における聴覚の計算理論に関する基礎的研究
声音分离提取中的听觉计算理论基础研究
- 批准号:
98J08110 - 财政年份:1998
- 资助金额:
$ 1.41万 - 项目类别:
Grant-in-Aid for JSPS Fellows
相似海外基金
雑音下における音声基本周波数抽出のための気導音、骨導音の利用に関する統合的研究
噪声下利用气导声和骨导声提取语音基频的综合研究
- 批准号:
22K12068 - 财政年份:2022
- 资助金额:
$ 1.41万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
ナノマテリアルを用いた大気下で最適駆動可能な演算ハードウェア素子の創製
使用纳米材料创建可以在大气中最佳运行的计算硬件元件
- 批准号:
21K14527 - 财政年份:2021
- 资助金额:
$ 1.41万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
Creation of brain-inspired material intelligence composed of nanomaterial network
创造由纳米材料网络组成的类脑物质智能
- 批准号:
20K22485 - 财政年份:2020
- 资助金额:
$ 1.41万 - 项目类别:
Grant-in-Aid for Research Activity Start-up
体内伝導音と音声信号の高次相関情報活用による騒音下でのベイズ推定に基づく信号抽出
利用人体传导声音和音频信号之间的高阶相关信息,在噪声条件下基于贝叶斯估计进行信号提取
- 批准号:
19K04428 - 财政年份:2019
- 资助金额:
$ 1.41万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Collection of weak level sounds with multiple microphones
使用多个麦克风采集弱电平声音
- 批准号:
19K12056 - 财政年份:2019
- 资助金额:
$ 1.41万 - 项目类别:
Grant-in-Aid for Scientific Research (C)