マイクロホンアレーを用いた音環境の認識に関する研究

基于麦克风阵列的声音环境识别研究

基本信息

  • 批准号:
    12780259
  • 负责人:
  • 金额:
    $ 1.15万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
  • 财政年份:
    2000
  • 资助国家:
    日本
  • 起止时间:
    2000 至 2001
  • 项目状态:
    已结题

项目摘要

1.個々の音を抽出する技術:マイクロホンアレーによる音源抽出法において,複数の音源の位置を同時に推定し,かつ個々の音源の移動を追尾する機能を実現するために,3次元トレリス法の適用について検討している.3次元トレリス法の性能は,マイクロホンアレーの指向性ビームの鋭さが十分ではなく,他の方向からの音が重畳するような場合,大きく低下してしまう.この問題に対処するための方法としては,複数の環境音が重畳している区間を事前に検出し,あらかじめ重畳を考慮したモデルを用意することが考えられる.本研究では,環境音モデルとHMM合成法を用いて複数の環境音が重畳している区間を検出する方法を提案した.孤立単語,連続単語,文章と環境音が重畳している状況を想定した評価実験を行った結果,環境音が重畳している区間,重畳している環境音の種類とそのSN比を良好に検出できることが分かった.今後,このような重畳区間情報を利用して,3次元トレリス法の性能改善を図る予定である.2.個々の音を認識する技術:HMMにより環境音をモデル化する際,HMMの単位と構造(状態数や状態の接続形態など)について検討する必要がある.まず,92種類の環境音を数種類の構造でモデル化し,認識実験を行った.その結果,環境音によって適した構造は異なっており,認識率に大きな差が生じることが分かった.次に,92種類の環境音を尤度最大化基準に基いてクラスタリングした結果,音響的に似た環境音同士がマージされるものの,クラスタリングの過程で構造を適応的に変化させる必要があることが分かった.そこで,HMMの単位や構造を,同じ基準の下で同時かつ自動的に決定する方法として,逐次状態分割による隠れマルコフ網の自動生成法を適用し,評価実験によりその有効性を確認した.今後,自動的に環境音を収録し,環境音のモデルを逐次的に更新する手法について検討する予定である.
1. Sound extraction technology: sound source extraction method, simultaneous estimation of the position of a plurality of sound sources, movement of a plurality of sound sources, rear-end tracking function, implementation of the application of three-dimensional sound extraction method, performance of three-dimensional sound extraction method, directivity, sharpness, and direction of sound extraction. The method of solving this problem is to examine the problem in advance in the interval between multiple environmental sounds. In this paper, we propose a new method to synthesize multiple environmental sounds by HMM. isolated language, continuous language, article and environmental sound from heavy to medium condition, think about it, evaluate it, conduct results, environmental sound from heavy to medium interval, heavy to medium environmental sound type, SN ratio, good detection, and so on. In the future, the use of this information in multiple intervals, three-dimensional separation method performance improvement, prediction, etc. 2. Sound recognition technology:HMM environmental sound,HMM unit structure (state number, state connection form), the need for discussion. 92 kinds of environmental sound, several kinds of structure, understanding and implementation. As a result, the environmental sound is different from the structure, and the recognition rate is different. 92 kinds of environmental sound, especially the maximum degree of the benchmark, the sound of the environmental sound is similar to the environmental sound, the structure of the process is suitable for the transformation of the necessary. In this case,HMM's single position structure, under the same base, simultaneously and automatically determine the method, the sequential state segmentation, the automatic generation method of the network is applicable, the evaluation of the effectiveness of the system is confirmed. In the future, automatic recording of ambient sound, ambient sound detection and successive updating of the method of detection and discussion of predetermined conditions.

项目成果

期刊论文数量(18)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
渡部生聖: "環境音モデルとHMM合成による音声区間検出法の文章発話への適用"電子情報通信学会研究技術報告, SP2001-88. 25-30 (2001)
Isei Watabe:“使用环境声音模型和 HMM 合成的语音区间检测方法在书面话语中的应用”IEICE 研究技术报告,SP2001-88 (2001)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Takeshi Yamada: "Voice activity detection using non-speech models and HMM composition"Proc. Workshop on Hands-free Speech Communication. 131-134 (2001)
Takeshi Yamada:“使用非语音模型和 HMM 组合进行语音活动检测”Proc。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
渡部生聖: "環境音モデルとHMM合成による音声区間検出法"日本音響学会講演論文集. 発表予定. (2001)
Kiyoshi Watanabe:“使用环境声音模型和 HMM 合成的语音间隔检测方法”,日本声学学会会议记录(2001 年)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
渡部生聖: "環境音モデルとHMM合成による音声区間検出法"日本音響学会講演論文集. 109-110 (2001)
Kiyoshi Watanabe:“使用环境声音模型和 HMM 合成的语音间隔检测方法”日本声学学会会议记录 109-110(2001)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Takeshi Yamada: "Voice activity detection using non-speech models and HMM composition"Proc.Workshop on Hands-free Speech Communication. 発表予定. (2001)
Takeshi Yamada:“使用非语音模型和 HMM 组合进行语音活动检测”Proc.免提语音通信研讨会(2001 年)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

山田 武志其他文献

文字供養に見る日本人の供養意識と彼我の温度差 : 文字を惜しむ
日本民众追悼意识与书面追悼会所见的温差:对书面文字感到遗憾。
  • DOI:
  • 发表时间:
    2016
  • 期刊:
  • 影响因子:
    0
  • 作者:
    高橋 玄;山田 武志;小野 順貴;牧野 昭二;安本真也・横田崇・牛山素行・石黒聡士・関谷直也;相田満
  • 通讯作者:
    相田満
伝達関数ゲイン基底NMFにおけるマイク数・マイク配置と目的音強調性能の関係
基于传递函数增益的 NMF 中麦克风数量、麦克风放置位置和目标声音增强性能之间的关系
  • DOI:
  • 发表时间:
    2014
  • 期刊:
  • 影响因子:
    0
  • 作者:
    村瀬 慶和;千葉 大将;小野 順貴;宮部 滋樹;山田 武志;牧野 昭二
  • 通讯作者:
    牧野 昭二
残響下音声認識評価基盤(CENSREC-4)の構築
混响语音识别评估平台(CENSREC-4)的构建
  • DOI:
  • 发表时间:
    2008
  • 期刊:
  • 影响因子:
    0
  • 作者:
    西浦 敬信;中山 雅人;傳田 遊亀;北岡 教英;山本 一公;山田 武志;藤本 雅清;柘植 覚;宮島 千代美;滝口 哲也;田村 哲嗣;小川 哲司;松田 繁樹;黒岩 眞吾;武田 一哉;中村 哲
  • 通讯作者:
    中村 哲
非同期マイクロホンアレーにおける伝達関数ゲイン基底非負値行列因子分解を用いた遠方音源抑圧
异步麦克风阵列中使用传递函数增益基础非负矩阵分解的远距离声源抑制
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    村瀬 慶和;小野 順貴;宮部 滋樹;山田 武志;牧野 昭二
  • 通讯作者:
    牧野 昭二
時間周波数スイッチングビームフォーマと時間周波数マスキングによる劣決定音声強調
使用时频切换波束形成器和时频掩蔽的欠定语音增强

山田 武志的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('山田 武志', 18)}}的其他基金

空間アテンション機構に基づく新しい音響シーン識別手法の確立
基于空间注意力机制的声场景识别新方法的建立
  • 批准号:
    20K11880
  • 财政年份:
    2020
  • 资助金额:
    $ 1.15万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)

相似海外基金

あらゆる音を柔軟に生成可能とする環境音合成の研究
环境声音合成研究,灵活生成各种声音
  • 批准号:
    22KJ3027
  • 财政年份:
    2023
  • 资助金额:
    $ 1.15万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
A study on environmental sound analysis based on unified and continual learning
基于统一持续学习的环境声分析研究
  • 批准号:
    23K16908
  • 财政年份:
    2023
  • 资助金额:
    $ 1.15万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
無線音響センサネットワークのEnd-to-End最適化による実環境音響シーン分析
通过无线声学传感器网络端到端优化进行真实世界声学场景分析
  • 批准号:
    22K17915
  • 财政年份:
    2022
  • 资助金额:
    $ 1.15万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
環境音を活用して人行動計測を実現する屋内測位法
利用环境声音测量人类行为的室内定位方法
  • 批准号:
    22K17922
  • 财政年份:
    2022
  • 资助金额:
    $ 1.15万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
Environmental Sound Recognition Before and After Cochlear Implantation in Adults
成人人工耳蜗植入前后的环境声音识别
  • 批准号:
    10684001
  • 财政年份:
    2021
  • 资助金额:
    $ 1.15万
  • 项目类别:
Environmental Sound Recognition Before and After Cochlear Implantation in Adults
成人人工耳蜗植入前后的环境声音识别
  • 批准号:
    10475184
  • 财政年份:
    2021
  • 资助金额:
    $ 1.15万
  • 项目类别:
Environmental Sound Recognition Before and After Cochlear Implantation in Adults
成人人工耳蜗植入前后的环境声音识别
  • 批准号:
    10291251
  • 财政年份:
    2021
  • 资助金额:
    $ 1.15万
  • 项目类别:
走行時に自動車へ到来する環境音の到来方向推定と音の種別のパターン認識
估计驾驶时到达汽车的环境声音的到达方向并识别声音类型的模式
  • 批准号:
    20H00914
  • 财政年份:
    2020
  • 资助金额:
    $ 1.15万
  • 项目类别:
    Grant-in-Aid for Encouragement of Scientists
Sound event detection method capable of analyzing any environmental sound
能够分析任何环境声音的声音事件检测方法
  • 批准号:
    19K20304
  • 财政年份:
    2019
  • 资助金额:
    $ 1.15万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
Transcribing Environmental Sound: The Acoustics of Post-industrial Space
转录环境声音:后工业空间的声学
  • 批准号:
    2238558
  • 财政年份:
    2019
  • 资助金额:
    $ 1.15万
  • 项目类别:
    Studentship
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了