マイクロホンアレーを用いた音環境の認識に関する研究

基于麦克风阵列的声音环境识别研究

基本信息

  • 批准号:
    12780259
  • 负责人:
  • 金额:
    $ 1.15万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
  • 财政年份:
    2000
  • 资助国家:
    日本
  • 起止时间:
    2000 至 2001
  • 项目状态:
    已结题

项目摘要

1.個々の音を抽出する技術:マイクロホンアレーによる音源抽出法において,複数の音源の位置を同時に推定し,かつ個々の音源の移動を追尾する機能を実現するために,3次元トレリス法の適用について検討している.3次元トレリス法の性能は,マイクロホンアレーの指向性ビームの鋭さが十分ではなく,他の方向からの音が重畳するような場合,大きく低下してしまう.この問題に対処するための方法としては,複数の環境音が重畳している区間を事前に検出し,あらかじめ重畳を考慮したモデルを用意することが考えられる.本研究では,環境音モデルとHMM合成法を用いて複数の環境音が重畳している区間を検出する方法を提案した.孤立単語,連続単語,文章と環境音が重畳している状況を想定した評価実験を行った結果,環境音が重畳している区間,重畳している環境音の種類とそのSN比を良好に検出できることが分かった.今後,このような重畳区間情報を利用して,3次元トレリス法の性能改善を図る予定である.2.個々の音を認識する技術:HMMにより環境音をモデル化する際,HMMの単位と構造(状態数や状態の接続形態など)について検討する必要がある.まず,92種類の環境音を数種類の構造でモデル化し,認識実験を行った.その結果,環境音によって適した構造は異なっており,認識率に大きな差が生じることが分かった.次に,92種類の環境音を尤度最大化基準に基いてクラスタリングした結果,音響的に似た環境音同士がマージされるものの,クラスタリングの過程で構造を適応的に変化させる必要があることが分かった.そこで,HMMの単位や構造を,同じ基準の下で同時かつ自動的に決定する方法として,逐次状態分割による隠れマルコフ網の自動生成法を適用し,評価実験によりその有効性を確認した.今後,自動的に環境音を収録し,環境音のモデルを逐次的に更新する手法について検討する予定である.
1。提取单个声音的技术:在麦克风阵列中,我们正在考虑使用3D Trellis方法同时估算多个声源的位置并跟踪单个声源的运动。当麦克风阵列的定向光束不足,并且来自其他方向的声音被叠加时,3D格子法的性能会大大降低。解决此问题的一种方法是叠加多种环境声音。 It is possible to detect the intervals that are in advance and prepare a model that takes into account the superposition in advance.In this study, we proposed a method for detecting intervals where multiple environmental sounds are superimposed using an environmental sound model and an HMM synthesis method.As a result of an evaluation experiment that assumes the situation where isolated words, continuous words, sentences and environmental sounds are superimposed, it was found that the region where environmental sounds are superimposed, the type叠加的环境声音可以成功地检测到其SN比率。未来,使用有关叠加部分的信息。我们计划提高3D格子方法的性能2。识别单个声音的技术:使用HMM对环境声音进行建模时,有必要考虑HMM的单元和结构(例如状态的数量和状态的连接形式)。首先,我们对92种具有几种类型结构的环境声音进行了建模,并进行了识别实验。结果,我们发现适当的结构取决于环境声音,并且识别率差异很大。接下来,我们根据可能性最大化标准使用92种类型的环境声音来创建云。恒星的结果导致声音相似的环境声音合并,但是在聚类过程中有必要自适应地改变结构。因此,采用顺序状态分裂生成隐藏的马尔可夫网络的一种自动方法,作为一种在相同标准下同时和自动确定HMM单元和结构的方法,并通过评估实验确认了其有效性。将来,我们将考虑一种自动录制环境声音并顺序更新环境声音模型的方法。

项目成果

期刊论文数量(18)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
渡部生聖: "環境音モデルとHMM合成による音声区間検出法の文章発話への適用"電子情報通信学会研究技術報告, SP2001-88. 25-30 (2001)
Isei Watabe:“使用环境声音模型和 HMM 合成的语音区间检测方法在书面话语中的应用”IEICE 研究技术报告,SP2001-88 (2001)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Takeshi Yamada: "Voice activity detection using non-speech models and HMM composition"Proc. Workshop on Hands-free Speech Communication. 131-134 (2001)
Takeshi Yamada:“使用非语音模型和 HMM 组合进行语音活动检测”Proc。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
渡部生聖: "環境音モデルとHMM合成による音声区間検出法"日本音響学会講演論文集. 発表予定. (2001)
Kiyoshi Watanabe:“使用环境声音模型和 HMM 合成的语音间隔检测方法”,日本声学学会会议记录(2001 年)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Takeshi Yamada: "Voice activity detection using non-speech models and HMM composition"Proc.Workshop on Hands-free Speech Communication. 発表予定. (2001)
Takeshi Yamada:“使用非语音模型和 HMM 组合进行语音活动检测”Proc.免提语音通信研讨会(2001 年)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
渡部生聖: "環境音モデルとHMM合成による音声区間検出法"日本音響学会講演論文集. 109-110 (2001)
Kiyoshi Watanabe:“使用环境声音模型和 HMM 合成的语音间隔检测方法”日本声学学会会议记录 109-110(2001)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

山田 武志其他文献

文字供養に見る日本人の供養意識と彼我の温度差 : 文字を惜しむ
日本民众追悼意识与书面追悼会所见的温差:对书面文字感到遗憾。
  • DOI:
  • 发表时间:
    2016
  • 期刊:
  • 影响因子:
    0
  • 作者:
    高橋 玄;山田 武志;小野 順貴;牧野 昭二;安本真也・横田崇・牛山素行・石黒聡士・関谷直也;相田満
  • 通讯作者:
    相田満
伝達関数ゲイン基底NMFにおけるマイク数・マイク配置と目的音強調性能の関係
基于传递函数增益的 NMF 中麦克风数量、麦克风放置位置和目标声音增强性能之间的关系
  • DOI:
  • 发表时间:
    2014
  • 期刊:
  • 影响因子:
    0
  • 作者:
    村瀬 慶和;千葉 大将;小野 順貴;宮部 滋樹;山田 武志;牧野 昭二
  • 通讯作者:
    牧野 昭二
残響下音声認識評価基盤(CENSREC-4)の構築
混响语音识别评估平台(CENSREC-4)的构建
  • DOI:
  • 发表时间:
    2008
  • 期刊:
  • 影响因子:
    0
  • 作者:
    西浦 敬信;中山 雅人;傳田 遊亀;北岡 教英;山本 一公;山田 武志;藤本 雅清;柘植 覚;宮島 千代美;滝口 哲也;田村 哲嗣;小川 哲司;松田 繁樹;黒岩 眞吾;武田 一哉;中村 哲
  • 通讯作者:
    中村 哲
非同期マイクロホンアレーにおける伝達関数ゲイン基底非負値行列因子分解を用いた遠方音源抑圧
异步麦克风阵列中使用传递函数增益基础非负矩阵分解的远距离声源抑制
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    村瀬 慶和;小野 順貴;宮部 滋樹;山田 武志;牧野 昭二
  • 通讯作者:
    牧野 昭二
時間周波数スイッチングビームフォーマと時間周波数マスキングによる劣決定音声強調
使用时频切换波束形成器和时频掩蔽的欠定语音增强

山田 武志的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('山田 武志', 18)}}的其他基金

空間アテンション機構に基づく新しい音響シーン識別手法の確立
基于空间注意力机制的声场景识别新方法的建立
  • 批准号:
    20K11880
  • 财政年份:
    2020
  • 资助金额:
    $ 1.15万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)

相似海外基金

読み書き困難児に音声に頼る学習方略を安心して奨められるようになるための環境整備
创造一个环境,鼓励有阅读和写作困难的孩子安心地使用基于音频的学习策略
  • 批准号:
    23K22301
  • 财政年份:
    2024
  • 资助金额:
    $ 1.15万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
異なる環境・マイク配置・間欠録音に適用可能なドメイン適応に基づく音響シーン認識
基于域适应的声学场景识别,适用于不同环境、麦克风放置和间歇录音
  • 批准号:
    24KJ1866
  • 财政年份:
    2024
  • 资助金额:
    $ 1.15万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
環境DNAと音響手法に基づく前線海域における魚類分布特性の解明
基于环境DNA和声学方法解析前海鱼类分布特征
  • 批准号:
    24KJ0662
  • 财政年份:
    2024
  • 资助金额:
    $ 1.15万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
腫瘍血管の酸素供給能から低酸素環境を可視化する光音響イメージング
基于肿瘤血管供氧能力的光声成像可视化缺氧环境
  • 批准号:
    23K28418
  • 财政年份:
    2024
  • 资助金额:
    $ 1.15万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
音環境の認識と理解のための革新的マイクロホンアレー基盤技術の深化
深化创新麦克风阵列基础技术,识别和理解声音环境
  • 批准号:
    23K28113
  • 财政年份:
    2024
  • 资助金额:
    $ 1.15万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了