空間アテンション機構に基づく新しい音響シーン識別手法の確立
基于空间注意力机制的声场景识别新方法的建立
基本信息
- 批准号:20K11880
- 负责人:
- 金额:$ 2.58万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research (C)
- 财政年份:2020
- 资助国家:日本
- 起止时间:2020-04-01 至 2024-03-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
音響シーン識別において複数のマイクの録音信号を入力することにより、音源の周波数特性などの音響特徴に加えて、個々の音源の方向などの空間特徴を活用することが可能となり、識別性能のさらなる向上が期待できる。本研究の目的は、空間信号処理と識別器の融合による新しい音響シーン識別手法を確立することである。具体的には、音響シーンに存在する複数の音源の中からより重要な音源に自動的に焦点を当てる機能(空間アテンション機構)を有するニューラルネットワークを新たに開発する。これにより、音源の方向や種類などの事前情報を必要とせず、識別に適した指向特性を入力信号から自動的に形成することが可能となる。2022年度は、前年度に引き続き、空間アテンション機構に基づく音響シーン識別手法の開発に取り組んだ。主な研究成果を以下にまとめる。(1)複数の空間フィルタ出力への自動重み付けに基づく識別手法の開発:これは、異なる指向特性を有する空間フィルタを複数個用意し、それぞれの空間フィルタ出力に対する重みを推定して識別する手法であり、前年度までに実験によりその有効性を示した。2022年度は識別性能のさらなる向上のために、重みの推定を短時間毎に実行する手法を検討した。(2)空間フィルタの自動推定に基づく識別手法の開発:これは、空間フィルタそのものを推定し、推定した空間フィルタの出力を用いて識別する手法である。空間フィルタ生成器と識別器のネットワークを同時最適化するための損失関数を考案し、実験によってその有効性を検証した。その結果、学習の際に目的音の方向や教師信号といった事前情報を一切必要とせずに、注目すべき音を強調する空間フィルタを自動的に生成できることを示した。これらの研究成果を査読付き国際会議論文、査読なし国内会議論文として発表した。
Sound シ ー ン recognition に お い て plural の マ イ ク の を audio signal into force す る こ と に よ り, audio の cycle for feature な ど の acoustics, 徴 に plus え て, a 々 の sound source direction の な ど の spatial 徴 を use す る こ と が may と な り, identify performance の さ ら な る upward が expect で き る. The purpose of this study is to establish する する とである とである とである by fusing による spatial signal processing と recognizer <e:1> with による new <s:1> audio シ <s:1> recognition method を. Specific に は, acoustics シ ー ン に exist す る plural の in audio の か ら よ り important な audio に automatic focus に を when て る function (space ア テ ン シ ョ ン) を have す る ニ ュ ー ラ ル ネ ッ ト ワ ー ク を new た に open 発 す る. こ れ に よ り や, audio の direction type な ど の prior intelligence を necessary と せ ず, identify に optimum し た pointing feature を signal into force か ら automatic に form す る こ と が may と な る. 2022 annual に は, former lead き 続 き, space ア テ ン シ ョ ン institutions に base づ く sound シ ー ン recognition technique の open 発 に group take り ん だ. The main research results of な を are as follows にまとめる. (1) the plural の space フ ィ ル タ output へ の automatic weighing み pay け に base づ く recognition technique の open 発 : こ れ は, different な る pointing feature を have す る space フ ィ ル タ を plural meaning し, そ れ ぞ れ の space フ ィ ル タ output に す seaborne る heavy み を presumption し て recognition す る gimmick で あ り, former annual ま で に be 験 に よ り そ の have sharper sex を shown し た. In 2022, the <s:1> identification performance さらなる さらなる upward ために ために and re-み <s:1> presumed を that each に actually used する method を検 to collect た in a short period of time. (2) spatial フ ィ ル タ の automatically presumed に base づ く recognition technique の open 発 : こ れ は, space フ ィ ル タ そ の も の を presumption し presumption, し た space フ ィ ル タ の output を with い て recognition す る gimmick で あ る. Space フ ィ ル タ generator と recognizer の ネ ッ ト ワ ー ク を and optimization す る た め の loss masato し を test case, be 験 に よ っ て そ の have sharper sex を 検 card し た. そ の results, the purpose of the study the event の に sound の signal direction や teachers と い っ た prior intelligence を all necessary と せ ず に, striking す べ き sound を emphasize す る space フ ィ ル タ を automated に で き る こ と を shown し た. The research results of て れら を can be found in 読 to submit papers to 読 international conferences, 読な to submit papers to 読な domestic conferences, と to て to publish papers to た.
项目成果
期刊论文数量(8)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Wave-U-Netと識別器のエンドツーエンド学習による音響シーン識別の検討
使用Wave-U-Net进行声学场景识别和分类器端到端学习的研究
- DOI:
- 发表时间:2022
- 期刊:
- 影响因子:0
- 作者:山田友紀;山田武志;牧野昭二
- 通讯作者:牧野昭二
Neural beamformer with automatic detection of notable sounds for acoustic scene classification
神经波束形成器可自动检测值得注意的声音以进行声学场景分类
- DOI:
- 发表时间:2022
- 期刊:
- 影响因子:0
- 作者:Sota Ichikawa;Takeshi Yamada;Shoji Makino
- 通讯作者:Shoji Makino
Monitoring of Domestic Activities Using Multiple Beamformers and Attention Mechanism
- DOI:10.2299/jsp.25.239
- 发表时间:2021-11
- 期刊:
- 影响因子:0
- 作者:Y. Kaneko;Takeshi Yamada;S. Makino
- 通讯作者:Y. Kaneko;Takeshi Yamada;S. Makino
音響イベント検出におけるGANを用いた弱ラベルデータ生成による半教師あり学習
在声学事件检测中使用 GAN 生成弱标签数据的半监督学习
- DOI:
- 发表时间:2021
- 期刊:
- 影响因子:0
- 作者:合馬一弥;山田武志;牧野昭二
- 通讯作者:牧野昭二
音響シーン識別のための注目すべき音を自動検出するニューラルビームフォーマの検討
神经波束形成器自动检测声学场景识别中值得注意的声音的研究
- DOI:
- 发表时间:2022
- 期刊:
- 影响因子:0
- 作者:市川創大;山田武志;牧野昭二
- 通讯作者:牧野昭二
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
山田 武志其他文献
文字供養に見る日本人の供養意識と彼我の温度差 : 文字を惜しむ
日本民众追悼意识与书面追悼会所见的温差:对书面文字感到遗憾。
- DOI:
- 发表时间:
2016 - 期刊:
- 影响因子:0
- 作者:
高橋 玄;山田 武志;小野 順貴;牧野 昭二;安本真也・横田崇・牛山素行・石黒聡士・関谷直也;相田満 - 通讯作者:
相田満
伝達関数ゲイン基底NMFにおけるマイク数・マイク配置と目的音強調性能の関係
基于传递函数增益的 NMF 中麦克风数量、麦克风放置位置和目标声音增强性能之间的关系
- DOI:
- 发表时间:
2014 - 期刊:
- 影响因子:0
- 作者:
村瀬 慶和;千葉 大将;小野 順貴;宮部 滋樹;山田 武志;牧野 昭二 - 通讯作者:
牧野 昭二
残響下音声認識評価基盤(CENSREC-4)の構築
混响语音识别评估平台(CENSREC-4)的构建
- DOI:
- 发表时间:
2008 - 期刊:
- 影响因子:0
- 作者:
西浦 敬信;中山 雅人;傳田 遊亀;北岡 教英;山本 一公;山田 武志;藤本 雅清;柘植 覚;宮島 千代美;滝口 哲也;田村 哲嗣;小川 哲司;松田 繁樹;黒岩 眞吾;武田 一哉;中村 哲 - 通讯作者:
中村 哲
非同期マイクロホンアレーにおける伝達関数ゲイン基底非負値行列因子分解を用いた遠方音源抑圧
异步麦克风阵列中使用传递函数增益基础非负矩阵分解的远距离声源抑制
- DOI:
- 发表时间:
2017 - 期刊:
- 影响因子:0
- 作者:
村瀬 慶和;小野 順貴;宮部 滋樹;山田 武志;牧野 昭二 - 通讯作者:
牧野 昭二
時間周波数スイッチングビームフォーマと時間周波数マスキングによる劣決定音声強調
使用时频切换波束形成器和时频掩蔽的欠定语音增强
- DOI:
- 发表时间:
2018 - 期刊:
- 影响因子:0
- 作者:
山岡 洸瑛;小野 順貴;牧野 昭二;山田 武志 - 通讯作者:
山田 武志
山田 武志的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('山田 武志', 18)}}的其他基金
マイクロホンアレーを用いた音環境の認識に関する研究
基于麦克风阵列的声音环境识别研究
- 批准号:
12780259 - 财政年份:2000
- 资助金额:
$ 2.58万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)














{{item.name}}会员




