音の三要素に基づく生成過程を考慮した深層ベイズ自動採譜

基于声音三要素考虑生成过程的深度贝叶斯自动转录

基本信息

  • 批准号:
    22KJ2959
  • 负责人:
  • 金额:
    $ 1.6万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
  • 财政年份:
    2023
  • 资助国家:
    日本
  • 起止时间:
    2023-03-08 至 2025-03-31
  • 项目状态:
    未结题

项目摘要

本研究では,音楽音響信号を構成する全ての楽器に対して各楽譜を推定する,多楽器自動採譜技術を扱う.現代音楽では多種多様な楽器が使用されるため,多楽器自動採譜は楽曲の保存と再現の観点から重要な技術である.従来は,採譜対象の楽器を事前に複数種類指定し,各楽器に依存した個別の採譜モデルを作成することで,各楽譜の推定が行われていた.そのため,使用する訓練データに含まれない楽器をはじめとする多くの楽器は楽譜推定の対象外となり,一般の楽曲に対しては採譜できないという問題があった.そこで本年度は,汎用性の高い採譜手法開発への第一歩として,1) 音高と音色の分離に基づく広範な楽器音の解析,2) 楽器音の分離表現学習における奏法の考慮,という観点から以下の研究を行った.(1) 認識と生成の双方向性を同時に扱う深層ベイズモデルを用いて,対象楽器に制限を設けることなく,楽器音の音高と音色を分析する手法を開発した.時変特徴と時不変特徴を備えた変分自己符号化器を用いて,楽器音から音高と音色を認識し,また生成および編集も可能にした.入力楽器音に与える音高と音色に関する摂動と各潜在表現の不変性に着目することで,ラベル情報に起因する対象楽器の制約を撤廃した.しかし,同一の楽器でも奏法(ビブラートやピッチカート等)の違いによって,異なる楽器として認識されてしまう問題も残った.(2) 楽器音認識のための分離表現学習において,従来主流であった二要素分離を発展させ,奏法の違いを陽に考慮する三要素分離手法を開発した.これにより,一つの楽器に対し複数の奏法を割り当てることを可能にした.さらに,異なる楽器音の間で各要素を置換することで,楽器や音高,奏法の変換を行う手法も開発した.
In this paper, we propose a new method for estimating the spectrum of acoustic signals. Modern music is used in a variety of ways, such as automatic music acquisition, music preservation and reproduction. In the past, a plurality of types of spectrometers were specified in advance, and each spectrometer was dependent on an individual spectrometer. For example, if you use a training tool, you will find that you have a problem estimating the object of the tool. This year, the first step in the development of a universal high-resolution spectral acquisition method is to: 1) analyze the basic range of instrument sounds in the separation of pitch and timbre; 2) consider the method of instrument sound separation in the study of instrument sound separation; and conduct research on the following points. (1)To understand the bidirectionality of the generation, the deep layer of the sound is used to set the limit of the sound generator, and the method of analyzing the pitch of the sound generator is developed. Time features, time not features, time not features The power of the sound and pitch of the sound is related to the potential performance of the sound. The same device can be used to solve the problem of violation of the law, different device can be used to solve the problem. (2)The separation of the two elements in the main stream of learning, the separation of the three elements in the violation of the law A single device can be used to create multiple images. In this paper, the different instrument sound between the various elements of the replacement, the instrument pitch, the method of changing the way to open.

项目成果

期刊论文数量(11)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Patch-based Memory Efficient Diffusion Probabilistic Models
基于补丁的内存有效扩散概率模型
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Aida Kazuhiro;Hirao Marina;Funabashi Aiko;Sugimura Natsuhiko;Ota Eisuke;Yamaguchi Junichiro;Shinei Arakawa
  • 通讯作者:
    Shinei Arakawa
覚醒度と感情価に基づく音楽による画像スタイル変換
基于唤醒水平和情绪效价使用音乐进行图像风格转换
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Yuko Arthurs;Imre Lahdelma;Tuomas Eerola;アーサーズ裕子;吉永 朋矢;神庭 有花
  • 通讯作者:
    神庭 有花
運指と運弓を反映した音響信号からのヴァイオリン演奏アニメーションの自動生成
根据反映指法和弓法的声学信号自动生成小提琴演奏动画
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Yuko Arthurs;Imre Lahdelma;Tuomas Eerola;アーサーズ裕子;吉永 朋矢;神庭 有花;柏木 爽良;Keitaro Tanaka;Asuka Hirata;平田 明日香
  • 通讯作者:
    平田 明日香
動画内話者の音声強調における特定背景音声の透過
增强视频中讲话者的声音时特定背景音频的透明度
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Yuko Arthurs;Imre Lahdelma;Tuomas Eerola;アーサーズ裕子;吉永 朋矢
  • 通讯作者:
    吉永 朋矢
口パク動画の発話内容推測における距離学習に基づく精度向上手法の検討
基于远程学习的口型同步视频言语内容估计精度改进方法检验
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Okita;T.; Aida;K.; Tanaka;K.; Ota;E.; Yamaguchi;J.;柏木 爽良
  • 通讯作者:
    柏木 爽良
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

田中 啓太郎其他文献

スペクトログラムとピッチグラムの深層クラスタリングに基づく複数楽器パート採譜
基于声谱图和音调图深度聚类的多乐器声部转录
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    田中 啓太郎;中塚 貴之;錦見 亮;吉井 和佳;森島 繁生
  • 通讯作者:
    森島 繁生
高発光性示す凝集誘起型有機蛍光分子の開発
具有高发光特性的聚集诱导有机荧光分子的开发
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    萩森 政頼;原 史子;吉田 達貞;小川 由起子;田中 啓太郎
  • 通讯作者:
    田中 啓太郎
NaIを用いたアシル化剤活性化の検討
使用 NaI 进行酰化剂活化的研究
  • DOI:
  • 发表时间:
    2013
  • 期刊:
  • 影响因子:
    0
  • 作者:
    田中 啓太郎;田中 誠一;萩森 政頼;山口 泰史
  • 通讯作者:
    山口 泰史
ルイス酸フリーのFriedel-Craftsアシル化反応の開発
无路易斯酸傅克酰化反应的发展
  • DOI:
  • 发表时间:
    2012
  • 期刊:
  • 影响因子:
    0
  • 作者:
    濱崎 翔平;萩森 政頼;田中 啓太郎;山口 泰史
  • 通讯作者:
    山口 泰史
深層クラスタリングを用いた任意楽器パートの自動採譜
使用深度聚类自动转录任意仪器部件
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    田中 啓太郎;中塚 貴之;錦見 亮;吉井 和佳;森島 繁生
  • 通讯作者:
    森島 繁生

田中 啓太郎的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

相似海外基金

形式言語理論に基づく自動採譜
基于形式语言理论的自动转录
  • 批准号:
    23K20392
  • 财政年份:
    2024
  • 资助金额:
    $ 1.6万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
難曲津軽三味線民謡(じょんがら節)の構成音素解明と高精度自動採譜手法に関する研究
津轻三味线疑难民歌构成音素解析及高精度自动转写方法研究
  • 批准号:
    21K11983
  • 财政年份:
    2021
  • 资助金额:
    $ 1.6万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
音楽理論知識に基づく音楽信号からの自動採譜の研究
基于乐理知识的音乐信号自动转录研究
  • 批准号:
    26880022
  • 财政年份:
    2014
  • 资助金额:
    $ 1.6万
  • 项目类别:
    Grant-in-Aid for Research Activity Start-up
自動採譜システムに関する研究
音乐自动转录系统的研究
  • 批准号:
    09J10015
  • 财政年份:
    2009
  • 资助金额:
    $ 1.6万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
Research and development of automatic exercise generation organization for the e-learning blending tuition who adapts himself to an individual 1
因人制宜的电子学习混合补习自动习题生成机构的研发1
  • 批准号:
    17500667
  • 财政年份:
    2005
  • 资助金额:
    $ 1.6万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了