分散ステレオマイクロフォンアレイに基づく音空間認識とその実世界応用

基于分布式立体声麦克风阵列的声音空间识别及其实际应用

基本信息

  • 批准号:
    19J20420
  • 负责人:
  • 金额:
    $ 1.98万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
  • 财政年份:
    2019
  • 资助国家:
    日本
  • 起止时间:
    2019-04-25 至 2022-03-31
  • 项目状态:
    已结题

项目摘要

本研究課題では,複数のマイクロフォンを空間上に分散配置した,分散マイクロフォンアレイ(分散アレイ)を用いた音空間認識技術の構築を目的としている.また,要素技術として,空間上に存在する目的音源信号の強調と音源位置情報の推定を統一的に行う技術の確立を目指している.これらの技術は,移動検知に基づく高齢者の見守りシステムや,ライフログの収集など,様々なサービスの実現に寄与することが期待される.昨年度までに,少ないマイクロフォンを用いて高性能な音源強調を達成する手法として,time-frequency-bin-wise linear combination beamformerを提案してきた.本手法は,目的音源を劣化させることなく強調可能な手法であり,工学的有用性が高い.最終年度では,本手法で使用するビームフォーマの数など,複数のパラメータを変えた場合の性能及び動作を実験的に調査した.本研究をまとめた論文は,音響信号処理分野のトップジャーナルである IEEE/ACM Transactions on Audio, Speech, and Language Processing に掲載された.また,音源位置情報を推定するための技術として,3つ以上のマイクロフォンで観測された音の到来時間差を,高精度かつ同時に推定する手法も提案してきた.本手法は複数の時間差推定値が無矛盾となるような制約を導入することで高い推定精度を達成している.最大16個のマイクロフォンからなる分散アレイを模したシミュレーション実験では,より多くのマイクロフォンを用いることでより高精度かつ無矛盾な時間差推定値が得られることを確認した.また,本手法をオンライン処理へと拡張した手法も提案している.本研究をまとめた論文は,IEEE Transactions on Signal Processing に投稿中である.
The purpose of this study is to construct a spatial recognition technique for multiple spatial distributions. In addition, the emphasis on the spatial existence of the target sound source signal and the estimation of the sound source position information are unified. This technology is based on mobile communication technology, mobile communication technology and mobile communication technology. A time-frequency-bin-wise linear combination beamformer is proposed for high performance audio. This technique is aimed at the degradation of sound sources. It is possible to emphasize the usefulness of engineering. In the final year, this method is used to investigate the performance and operation of the system. IEEE/ACM Transactions on Audio, Speech, and Language Processing. A technique for estimating sound source position information is proposed, which is more than 3 times the arrival time difference of sound source. The method has no contradiction between multiple time difference estimation values and high estimation accuracy. The maximum of 16 pieces of data is the number of pieces of data that can be used to estimate the time difference between the two pieces. This technique is very useful for the treatment of diseases. IEEE Transactions on Signal Processing

项目成果

期刊论文数量(13)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Sampling Frequency Mismatch Estimation by Auxiliary-Function-Based Iterative Maximization of Double-Cross-Correlation
基于辅助函数的双互相关迭代最大化的采样频率失配估计
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Kouei Yamaoka;Nobutaka Ono;and Yukoh Wakabayashi
  • 通讯作者:
    and Yukoh Wakabayashi
補助関数法を用いた相互相関の最大化によるサンプリング周波数ミスマッチ推定
利用辅助函数法最大化互相关估计采样频率失配
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    山岡 洸瑛;シャイブラー ロビン;小野 順貴;若林 佑幸
  • 通讯作者:
    若林 佑幸
補助関数法を用いた複数時間差のオンライン推定
利用辅助函数法在线估计多重时间差
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    山岡 洸瑛;中嶋 大志;若林 佑幸;小野 順貴
  • 通讯作者:
    小野 順貴
Time-Frequency-Bin-Wise Linear Combination of Beamformers for Distortionless Signal Enhancement
用于无失真信号增强的波束形成器的时频分箱线性组合
Time-frequency-bin-wise switching of minimum variance distortionless response beamformer for underdetermined situations
欠定情况下最小方差无失真响应波束形成器的时频分箱切换
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    K. Yamaoka;N. Ono;S. Makino;and T. Yamada
  • 通讯作者:
    and T. Yamada
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

山岡 洸瑛其他文献

マッシュアップ生成のための楽曲ミックスの良さのDNNによる評価の検討
使用 DNN 检验用于混搭生成的歌曲组合质量评估
補助関数法による複数の非同期録音信号のブラインド同期
利用辅助函数法实现多个异步记录信号的盲同步
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    升山 義紀;山岡 洸瑛;小野 順貴
  • 通讯作者:
    小野 順貴
非同期会話録音に対する時間周波数マスキングと独立ベクトル分析を用いた音源分離の検討
异步对话录音时频掩蔽和独立矢量分析的声源分离研究
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    南木 春希;山岡 洸瑛;若林 佑幸;小野 順貴
  • 通讯作者:
    小野 順貴
データサイエンスが使えるようになるまで
直到你能够使用数据科学
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    南木 春希;山岡 洸瑛;若林 佑幸;小野 順貴;前川喜久雄
  • 通讯作者:
    前川喜久雄
因果的MPDRビームフォーマの近接分離最適化による設計
基于邻近分离优化的因果 MPDR 波束形成器设计
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    升山 義紀;山岡 洸瑛;木下 裕磨;小野 順貴
  • 通讯作者:
    小野 順貴

山岡 洸瑛的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

相似海外基金

複素スペクトル領域での振幅位相関係に基づく新たな音響信号処理の創出
基于复谱域中的幅相关系创建新的声学信号处理
  • 批准号:
    24K20838
  • 财政年份:
    2024
  • 资助金额:
    $ 1.98万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
ニューラルネットワークを用いた統計モデルの学習と音響信号処理への応用
使用神经网络学习统计模型及其在声学信号处理中的应用
  • 批准号:
    21K17769
  • 财政年份:
    2021
  • 资助金额:
    $ 1.98万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
Multi-channel Audio Signal Processing Based on Sound-to-Light Conversion and Video Camera
基于声光转换和摄像机的多通道音频信号处理
  • 批准号:
    17F17049
  • 财政年份:
    2017
  • 资助金额:
    $ 1.98万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
System for real-time audio signal processing and modification
实时音频信号处理和修改系统
  • 批准号:
    500598-2016
  • 财政年份:
    2016
  • 资助金额:
    $ 1.98万
  • 项目类别:
    Experience Awards (previously Industrial Undergraduate Student Research Awards)
Audio signal processing in wavenumber domain for 3D sound walkthrough system
3D 声音演练系统的波数域音频信号处理
  • 批准号:
    15H02728
  • 财政年份:
    2015
  • 资助金额:
    $ 1.98万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
人間の聴覚システムの模倣に基づく自律的音響信号処理の研究
基于模仿人类听觉系统的自主声信号处理研究
  • 批准号:
    15J09992
  • 财政年份:
    2015
  • 资助金额:
    $ 1.98万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
Unifying audio signal processing and machine learning: a fundamental framework for machine hearing
统一音频信号处理和机器学习:机器听力的基本框架
  • 批准号:
    EP/L000776/1
  • 财政年份:
    2013
  • 资助金额:
    $ 1.98万
  • 项目类别:
    Research Grant
multichannel audio signal processing and information extraction
多通道音频信号处理和信息提取
  • 批准号:
    6652-2009
  • 财政年份:
    2013
  • 资助金额:
    $ 1.98万
  • 项目类别:
    Discovery Grants Program - Individual
multichannel audio signal processing and information extraction
多通道音频信号处理和信息提取
  • 批准号:
    6652-2009
  • 财政年份:
    2012
  • 资助金额:
    $ 1.98万
  • 项目类别:
    Discovery Grants Program - Individual
multichannel audio signal processing and information extraction
多通道音频信号处理和信息提取
  • 批准号:
    6652-2009
  • 财政年份:
    2011
  • 资助金额:
    $ 1.98万
  • 项目类别:
    Discovery Grants Program - Individual
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了