変調伝達関数に基づいた骨導音声の明瞭度回復法の基礎検討

基于调制传递函数的骨导语音清晰度恢复方法基础研究

基本信息

项目摘要

本研究では,高騒音環境下での音声会話を実現するために骨導マイクを利用した補聴システムの構築を目指している.骨導マイクは雑音に頑健に音声を集音することができるが,その音声の音質や明瞭度は著しく低下しているため,そのままでは利用することができない.そこで,気導音声を入力,骨導音声を出力とした伝達系を想定し,この伝達特性を明らかにするとともに,伝達特性の逆特性を利用した骨導音声の明瞭度回復法の可能性を探る.本年度は,昨年度提案したプロトタイプモデルの改良を行うとともに,提案モデルについて二つの評価検討を行った.1)骨導音声回復法の改良線形予測(LP)法に基づいたプロトタイプモデルについて,骨導音声と気導音声間でLP残差がほぼ一定であること,LP係数を逆推定可能であること,ならびにより安定なLP表現上のLSF係数を逆推定可能であることを利用して,モデルを改良し,完全なたブラインド回復法を提案した.逆推定にはニューラルネットワーク等の学習法を利用した.2)客観評価による検討提案モデルを定量的に評価するために,昨年度構築した骨導・気導音声を評価データとして利用した.客観評価尺度としてスペクトル歪,LPC距離,MFCC距離を利用し,LP法ならびにLPベースのブラインド回復法が有効に骨導音声を気導音声並みに回復できることを示した.この成果は骨導音声に対する音声認識の前処理として利用可能であることを実証している.3)主観評価による検討同じく主観評価として,MOSテスト,改良Rhymeテスト,単語了解度試験を行った.改良Rhymeテストでは英語音声データに対してのみ,単語了解度試験では日本語音声データに対してのみ,MOSテストでは両データに対して行った.その結果,提案法が観測した骨導音声のみから,いずれも骨導音声の低下した音質や音声明瞭度を著しく改善できることを示した.
This study aims to provide guidance for the construction of sound conversation in high noise environments. The sound quality of the sound is clear and low. To explore the possibility of using the method of clarity recovery of sound transmission characteristics. This year's proposal is different from yesterday's proposal. 1) Improved linear prediction (LP) method of bone cold sound recovery method. 2) LP coefficient inverse estimation is possible. The LSF coefficient in LP performance can be estimated by inverse method. 2) Customer evaluation, evaluation Customer evaluation criteria,LPC distance,MFCC distance, LP method, and recovery method are used. The results of this study include the pre-processing of sound recognition, the utilization of possibility, the implementation of evidence, the evaluation of main sound, the improvement of Rhyme, and the implementation of language understanding test. The improved Rhyme test is aimed at English pronunciation, Japanese pronunciation, and Russian pronunciation. As a result, the proposed method has been tested to improve the quality of sound and the clarity of sound.

项目成果

期刊论文数量(3)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
A study on restoration of bone-conducted speech with the LPC-based model
基于LPC模型的骨导语音恢复研究
A study on an LPC-based restoration model for improving the voice-quality of bone-conducted speech
基于LPC的骨导语音音质恢复模型研究
  • DOI:
  • 发表时间:
    2006
  • 期刊:
  • 影响因子:
    0
  • 作者:
    T.T.Vu;M.Unoki;M.Akagi
  • 通讯作者:
    M.Akagi
A method for restoring bone-conducted speech based on the LPC model
一种基于LPC模型的骨导语音恢复方法
An LP-based Blind Restoration Method for Improving Intelligibility of Bone-conducted Speech
基于LP的提高骨导语音清晰度的盲恢复方法
A Study on Restoration of Bone-conducted speech with MTF-based and LP-based Models
基于MTF和LP模型的骨导语音恢复研究
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

鵜木 祐史其他文献

自己聴取音の印象に関する個人性の調査
关于自听声音印象的个性调查
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    森田 翔太;鳥谷 輝樹;鵜木 祐史
  • 通讯作者:
    鵜木 祐史
Internal logic viewed from observation space: Theory and a case study
从观察空间看内部逻辑:理论与案例研究
  • DOI:
  • 发表时间:
    2007
  • 期刊:
  • 影响因子:
    0
  • 作者:
    羽二 生篤;鵜木 祐史;赤木 正人;M. Hatakeyama
  • 通讯作者:
    M. Hatakeyama
Controlling engine data : Nonperiodic fluctuations in a spark ignition engine of motorcycle and its stabilization
控制发动机数据:摩托车火花点火发动机的非周期性波动及其稳定性
脳の中のカオス
大脑混乱
  • DOI:
  • 发表时间:
    2006
  • 期刊:
  • 影响因子:
    0
  • 作者:
    羽二 生篤;鵜木 祐史;赤木 正人;M. Hatakeyama;Kazuhiro Matsumoto;I. Tsuda;Y. Fukushima;伊藤孝男;Y.Yamaguti;K.Matsumoto;S.Tadokoro;津田一郎
  • 通讯作者:
    津田一郎
音色属性の客観評価指標を活用した異常音検知の検討
基于音色属性客观评价指标的异常声音检测研究
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    大田 恭士;倉 誠吾;鵜木 祐史
  • 通讯作者:
    鵜木 祐史

鵜木 祐史的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('鵜木 祐史', 18)}}的其他基金

振幅変調知覚に基づく聴覚エンリッチメント:人工内耳用音声信号処理の研究
基于调幅感知的听觉丰富:人工耳蜗音频信号处理研究
  • 批准号:
    23K21679
  • 财政年份:
    2024
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Voice information-hiding/anonymization technology for voice privacy protection
语音信息隐藏/匿名化技术,保护语音隐私
  • 批准号:
    23K18491
  • 财政年份:
    2023
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Challenging Research (Exploratory)
Auditory Enrichment based on perception of amplitude modulation: Study on speech signal processing for Cochlear Implant
基于幅度调制感知的听觉丰富:人工耳蜗语音信号处理研究
  • 批准号:
    21H03463
  • 财政年份:
    2021
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
VOICE 2.0: towards augmentation of enriched speech communication
VOICE 2.0:增强丰富的语音通信
  • 批准号:
    20KK0233
  • 财政年份:
    2020
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Fund for the Promotion of Joint International Research (Fostering Joint International Research (B))
蝸牛遅延特性を利用した音信号への情報ハイディング
利用耳蜗延迟特性将信息隐藏到声音信号中
  • 批准号:
    21650035
  • 财政年份:
    2009
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Challenging Exploratory Research
雑音・残響環境下における基本周波数推定法に関する研究
噪声/混响环境下基频估计方法研究
  • 批准号:
    14780267
  • 财政年份:
    2002
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
聴覚的音分離の計算理論に関する研究
听觉声音分离计算理论研究
  • 批准号:
    00J04717
  • 财政年份:
    2000
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
音の分離・抽出における聴覚の計算理論に関する基礎的研究
声音分离提取中的听觉计算理论基础研究
  • 批准号:
    98J08110
  • 财政年份:
    1998
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了