音楽音響信号の音源分離における統合的理論の構築とその応用

音乐声信号源分离综合理论构建及其应用

基本信息

  • 批准号:
    08J02757
  • 负责人:
  • 金额:
    $ 1.15万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
  • 财政年份:
    2008
  • 资助国家:
    日本
  • 起止时间:
    2008 至 2010
  • 项目状态:
    已结题

项目摘要

本年度は,音源分離と楽器名同定の同時処理,および音源分離の応用としての類似楽曲検索システムに関する研究に取り組み,論文を発表した.1.複数楽器混合モデルのパラメータ推定と楽器名同定への応用 複雑な音楽音響信号中の楽器音を認識し,信号からその構成要素である楽器音や歌声を分離することは,近年の音楽情報処理における重要な要素技術である.混合音の音楽音響信号および楽曲中の各単音の音高と発音区間を入力として,各単音の分離音響信号と楽器名同定結果を出力する問題に取り組んだ.2~3楽器音の混合音に対して楽器音を分離しそれぞれの楽器名を同定する実験を行ったところ,2音の混合に対する平均音源同定正解率は72.1%,3音に対しては54.8%であった.音源分離性能は2音,3音のそれぞれに対して平均対数スペクトル距離が3.12,3.65であった.さらに,楽器名同定の正解によって音源分離性能が向上することを確認した.2.楽器音イコライザによる音色の類似度に基づく楽曲検索システム 類似楽曲検索とは,ユーザが指定した楽曲をクエリとして与え,楽曲を類似性に基づいてランキングする検索手法である.楽器音量バランスを操作したクエリ楽曲を用いて類似楽曲検索を行い,検索結果のジャンルからクエリ楽曲のジャンルシフトを調査した.楽器音量バランスとジャンルシフトとの間には合理的な関係があり,音楽ジャンルの典型的なイメージと整合していることが確認できた.ボーカルパートとドラムスパートでは,分離音と原音で同じ傾向のジャンルシフトが確認されたが,ギターパートでは異なっていた.
今年,我们研究了类似的音乐搜索系统的研究,作为声音源分离和仪器名称标识以及音频源分离的应用,并发表了一篇论文1。多个仪器混合模型的参数估计以及对仪器名称标识的应用。在复杂的音乐声信号中识别乐器的声音,并将乐器的声音和唱歌声音分开,这些声音和唱歌声音与信号是它们的组成部分,是最近音乐信息处理中的重要元素技术。我们解决了输出每个单个音符的分离声学信号的问题,以及使用混合声音的音乐声学信号以及歌曲中每个音符的音调和发音间隔的结果。我们进行了一个实验,在其中,仪器的声音分开,以2至3个乐器的混合声音并识别每个仪器名称,而两个音符的平均正确答案率为72.1%和54.8%,三个音符的平均正确答案。两个音符中的每个音符的声音分离性能为3.12和3.65。此外,我们确认通过仪器名称识别的正确答案提高了声源分离性能2。基于音调相似性的音乐搜索系统使用乐器声音均衡器相似的歌曲搜索是一种搜索技术,其中将用户指定的歌曲作为查询给出,并根据相似性对歌曲进行排名。使用操纵仪器量平衡的查询歌曲搜索了类似的歌曲,并且根据搜索结果的流派研究了查询歌曲的流派变化。仪器体积平衡与流派变化之间存在合理的关系,并且可以证实它们与音乐流派的典型形象一致。在人声部分和鼓声中,在单独的和原始声音之间证实了类型转移的趋势,但吉他部分是不同的。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Parameter Estimation for Harmonic and Inharmonic Models by Using Timbre Feature Distributions
使用音色特征分布对谐波和非谐波模型进行参数估计
  • DOI:
  • 发表时间:
    2009
  • 期刊:
  • 影响因子:
    0
  • 作者:
    糸山克寿;後藤真孝;駒谷和範;尾形哲也;奥乃博
  • 通讯作者:
    奥乃博
楽器音イコライザ:楽器パートの音量を操作可能なオーディオプレーヤ
乐器声音均衡器:允许您控制乐器部分音量的音频播放器
  • DOI:
  • 发表时间:
    2008
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Katsutoshi Itoyama;Masataka Goto;Kazunori Komatani;Tetsuya Ogata;Hiroshi G.Okuno;糸山克寿;糸山克寿;糸山克寿;糸山克寿;糸山克寿
  • 通讯作者:
    糸山克寿
音楽音響信号生成システム
音乐声信号发生系统
  • DOI:
  • 发表时间:
    2010
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
複数楽器混合モデルのパラメータ推定と楽器名同定への応用
多仪器混合模型参数估计及其在仪器名称识别中的应用
  • DOI:
  • 发表时间:
    2009
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Katsutoshi Itoyama;Masataka Goto;Kazunori Komatani;Tetsuya Ogata;Hiroshi G.Okuno;糸山克寿;糸山克寿;糸山克寿
  • 通讯作者:
    糸山克寿
多重奏楽曲の楽器音量バランス変化による音楽ジャンルシフト
由于二重奏中乐器音量平衡的变化而导致音乐流派的转变
  • DOI:
  • 发表时间:
    2009
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Katsutoshi Itoyama;Masataka Goto;Kazunori Komatani;Tetsuya Ogata;Hiroshi G.Okuno;糸山克寿;糸山克寿;糸山克寿;糸山克寿
  • 通讯作者:
    糸山克寿
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

糸山 克寿其他文献

変分ベイズ多チャネルRNMFに基づく柔軟索状レスキューロボットのための音声強調
基于变分贝叶斯多通道RNMF的软绳救援机器人语音增强
  • DOI:
  • 发表时间:
    2016
  • 期刊:
  • 影响因子:
    0
  • 作者:
    坂東 宜昭;糸山 克寿;昆陽 雅司;田所 諭;中臺 一博;吉井 和佳;奥乃 博
  • 通讯作者:
    奥乃 博
プログラミング基礎教育のための図形言語の3D拡張
用于基础编程教育的图形语言的 3D 扩展
  • DOI:
  • 发表时间:
    2015
  • 期刊:
  • 影响因子:
    0
  • 作者:
    古川 孝太郎;糸山 克寿;吉井 和佳;奥乃 博
  • 通讯作者:
    奥乃 博
市販楽曲中の歌声の分離と音高推定に基づく歌唱表現編集システム
基于市售歌曲声乐分离和音高估计的演唱表达编辑系统
  • DOI:
  • 发表时间:
    2015
  • 期刊:
  • 影响因子:
    0
  • 作者:
    池宮 由楽;糸山 克寿;吉井 和佳
  • 通讯作者:
    吉井 和佳
非同期マイクロホンアレイを搭載した複数ロボットによる音環境マップの協調オンライン推定
配备异步麦克风阵列的多个机器人协同在线估计声环境图
  • DOI:
  • 发表时间:
    2016
  • 期刊:
  • 影响因子:
    0
  • 作者:
    関口 航平;坂東 宜昭;中村 圭佑;中臺 一博;糸山 克寿;吉井 和佳
  • 通讯作者:
    吉井 和佳
アンサンブル時間周波数マスクを用いた複数の音声強調手法の統合
使用集成时频掩模集成多种语音增强方法
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    藤田 雅彦;糸山 克寿;西田 健次;中臺 一博
  • 通讯作者:
    中臺 一博

糸山 克寿的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('糸山 克寿', 18)}}的其他基金

Spatio-temporal calibration of asynchronous distributed microhoone arrays in dynamic environment
动态环境下异步分布式微霍恩阵列时空校准
  • 批准号:
    23K11160
  • 财政年份:
    2023
  • 资助金额:
    $ 1.15万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)

相似海外基金

音響信号の知識を暗黙的に反映した音符列を対象とした楽器分類モデルの構築
为隐式反映声学信号知识的音符序列构建乐器分类模型
  • 批准号:
    24K20798
  • 财政年份:
    2024
  • 资助金额:
    $ 1.15万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
選択的音楽聴取を実現するリアルタイム音源分離とその応用
实时声源分离及其在选择性音乐收听中的应用
  • 批准号:
    22KJ2548
  • 财政年份:
    2023
  • 资助金额:
    $ 1.15万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
Estimation of listener's emotion curve from acoustic parameters
从声学参数估计听者的情绪曲线
  • 批准号:
    21J13539
  • 财政年份:
    2021
  • 资助金额:
    $ 1.15万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
Analysis of interaction between a performer and the audience: Effects of auditory feedback on the synchronization
表演者和观众之间的互动分析:听觉反馈对同步的影响
  • 批准号:
    19K02769
  • 财政年份:
    2019
  • 资助金额:
    $ 1.15万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Audio-Visual Music Understanding Based on Integration of Recognition and Generative Processes
基于识别和生成过程整合的视听音乐理解
  • 批准号:
    19H04137
  • 财政年份:
    2019
  • 资助金额:
    $ 1.15万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了