雑音下における音声基本周波数抽出のための気導音、骨導音の利用に関する統合的研究

噪声下利用气导声和骨导声提取语音基频的综合研究

基本信息

  • 批准号:
    22K12068
  • 负责人:
  • 金额:
    $ 2.16万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
  • 财政年份:
    2022
  • 资助国家:
    日本
  • 起止时间:
    2022-04-01 至 2025-03-31
  • 项目状态:
    未结题

项目摘要

音声認識、話者認識においては、無雑音環境下においてほぼ100%に近い認識率を得るに至っている。しかしながら、実環境としての雑音環境下においては、認識率が大幅に低下してしまうことがよく知られている。一方、電話においても、駅や交差点など、高騒音を伴う環境では、情報を正確に伝達できない状況にある。従って、今後の音声処理システムの進展においては、雑音対策が極めて重要である。しかしながら、環境雑音は多種多用で、最近の先端的機械学習法を利用するとしても、全環境雑音を学習してしまうような考え方は非現実的と見なせる。現実的には、雑音下での音声分析の精度を向上し、その結果を雑音低減する方式(音声強調方式)等に適用し、音声認識、話者認識などの音声処理システムへ応用する方向性が、より大きな進展をもたらすと申請者は考える。このとき、重要な役割を果たすのが、音声の代表的な特徴量の基本周波数(あるいはその逆数であるピッチ)である。基本周波数が正確に抽出されることにより、音声強調を始め、多くの音声処理システムに利用可能であり、音声処理システムの質的向上へつながる。従って、これまで多くの基本周波数抽出方法が検討されてきたが、雑音環境下では抽出誤りが多く、また、雑音の特性によって抽出誤りが大きく左右されるという問題が残されていた。本年度は、混入する雑音の特性を分析し、その基本周波数抽出へ及ぼす影響について検討を行った。基本周波数抽出手法においては、フレーム処理に基づく従来手法に加え、最近注目を集めている深層学習を用いた方法の実行精度の比較検討を行った。
Voice recognition, speaker recognition, and the recognition rate of においてほぼ100% in a no-sound environment, the recognition rate is るに to っている.しかしながら, 実 environment としての囑音组 においては, the recognition rate is significantly lowered してしまうことがよく知られている. One party, the phone number is the same, the station number is the intersection number, the high-pitched voice is the environment, the information is correct, the situation is the same.従って, sound processing from now on, progress of the sound processing, 雑音対泽が极めてimportant, である.しかしながら、Environment sound はMulti-purpose で、Utilization of the latest cutting-edge machine learning method するとしても, full environment 雑音を学してしまうようなtestえ方は non-present と见なせる. It is applicable to the current には, the accuracy of sound analysis under the 雑音, and the その results and the sound reduction method (sound emphasis method), etc. Sound recognition, speaker recognition, sound processing, sound processing, directionality, and progress, application, test, and test.このとき, important なservice cut を Fruit たすのが, and sound の represent the な special 徴quantity of the basic cycle number (あるいはその inverse number であるピッチ) である. The basic frequency is correct and the sound is extracted, the sound is emphasized, and the sound is multi-voiced. The processing of the sound processing is possible, and the sound processing of the sound processing is high quality.従って、これまで多くのBasic frequency extraction method が検 Discussion されてきたが、The wrong way to extract the では under the sound environmentが多く、また、曑音のcharacteristicsによってdraw the wrong りが大きくleft and right されるというproblem が residual されていた. This year, the analysis of the characteristics of the mixed sound, the extraction of the basic frequency and the influence of the basic cycle number are carried out. The basic frequency extraction technique is においては, the フレーム processing is based on the づく従来 technique に加え, and the most Recently, we have focused on the comparison of deep learning and accuracy using the method.

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

島村 徹也其他文献

島村 徹也的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('島村 徹也', 18)}}的其他基金

骨導振動のピックアップ最適化と骨導音声の品質改善
优化骨传导振动拾音,提升骨传导音质
  • 批准号:
    09F09262
  • 财政年份:
    2009
  • 资助金额:
    $ 2.16万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
適応スペクトル推定における解析信号の利用
分析信号在自适应频谱估计中的利用
  • 批准号:
    06750441
  • 财政年份:
    1994
  • 资助金额:
    $ 2.16万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)

相似海外基金

気導音および骨導音が食感評価に与える影響に関する研究
气导声和骨导声对食品质地评价的影响研究
  • 批准号:
    18791463
  • 财政年份:
    2006
  • 资助金额:
    $ 2.16万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了