音の三要素に基づく生成過程を考慮した深層ベイズ自動採譜
基于声音三要素考虑生成过程的深度贝叶斯自动转录
基本信息
- 批准号:22KJ2959
- 负责人:
- 金额:$ 1.6万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for JSPS Fellows
- 财政年份:2023
- 资助国家:日本
- 起止时间:2023-03-08 至 2025-03-31
- 项目状态:未结题
- 来源:
- 关键词:
项目摘要
本研究では,音楽音響信号を構成する全ての楽器に対して各楽譜を推定する,多楽器自動採譜技術を扱う.現代音楽では多種多様な楽器が使用されるため,多楽器自動採譜は楽曲の保存と再現の観点から重要な技術である.従来は,採譜対象の楽器を事前に複数種類指定し,各楽器に依存した個別の採譜モデルを作成することで,各楽譜の推定が行われていた.そのため,使用する訓練データに含まれない楽器をはじめとする多くの楽器は楽譜推定の対象外となり,一般の楽曲に対しては採譜できないという問題があった.そこで本年度は,汎用性の高い採譜手法開発への第一歩として,1) 音高と音色の分離に基づく広範な楽器音の解析,2) 楽器音の分離表現学習における奏法の考慮,という観点から以下の研究を行った.(1) 認識と生成の双方向性を同時に扱う深層ベイズモデルを用いて,対象楽器に制限を設けることなく,楽器音の音高と音色を分析する手法を開発した.時変特徴と時不変特徴を備えた変分自己符号化器を用いて,楽器音から音高と音色を認識し,また生成および編集も可能にした.入力楽器音に与える音高と音色に関する摂動と各潜在表現の不変性に着目することで,ラベル情報に起因する対象楽器の制約を撤廃した.しかし,同一の楽器でも奏法(ビブラートやピッチカート等)の違いによって,異なる楽器として認識されてしまう問題も残った.(2) 楽器音認識のための分離表現学習において,従来主流であった二要素分離を発展させ,奏法の違いを陽に考慮する三要素分離手法を開発した.これにより,一つの楽器に対し複数の奏法を割り当てることを可能にした.さらに,異なる楽器音の間で各要素を置換することで,楽器や音高,奏法の変換を行う手法も開発した.
这项研究涉及自动多仪器翻译技术,该技术估计了构成音乐声音的所有乐器的每个乐曲。由于在现代音乐中使用了各种各样的乐器,因此从保存和复制音乐的角度来看,自动多动抄写是一项重要技术。过去,预先指定要转录的多种类型的仪器,并创建了依赖每种仪器的单个转录模型,从而估计每个分数。因此,许多乐器,包括所使用的训练数据中未包含的乐器,不受乐谱估算的约束,并且存在一个问题,即无法转录普通歌曲的音乐。因此,今年,作为开发高度通用的翻译技术的第一步,我们从1)基于音高和音调的分离来分析各种乐器声音的角度进行了以下研究,以及2)考虑到学习的播放方法,以分离和表达乐器声音的表达方式。 (1)使用同时处理识别和生成的双向的深贝叶斯模型,我们开发了一种分析仪器声音音调和音调的方法,而无需限制目标仪器。可以从仪器的声音中识别出差异自我编码器,并具有时间变化和时间不变的功能,也可以从仪器的声音中识别出来,也可以生成和编辑。通过关注有关在输入仪器声音上应用的音高和音调的扰动以及每个潜在表达式的不变性,就废除了标签信息引起的目标仪器的约束。但是,由于演奏技术的差异(颤音,俯仰推车等),也存在一个问题,即即使是同一仪器也可以被识别为不同的乐器。 (2)在学习仪器声音识别的分离表达式时,我们开发了一种以前是主流的三元素分离技术,并以明确考虑的方式考虑了播放方法的差异。这使得可以为一种乐器分配多种弹奏技术。此外,我们还开发了一种通过在不同仪器声音之间替换每个元素来转换仪器,音高和演奏技术的方法。
项目成果
期刊论文数量(11)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Patch-based Memory Efficient Diffusion Probabilistic Models
基于补丁的内存有效扩散概率模型
- DOI:
- 发表时间:2022
- 期刊:
- 影响因子:0
- 作者:Aida Kazuhiro;Hirao Marina;Funabashi Aiko;Sugimura Natsuhiko;Ota Eisuke;Yamaguchi Junichiro;Shinei Arakawa
- 通讯作者:Shinei Arakawa
覚醒度と感情価に基づく音楽による画像スタイル変換
基于唤醒水平和情绪效价使用音乐进行图像风格转换
- DOI:
- 发表时间:2023
- 期刊:
- 影响因子:0
- 作者:Yuko Arthurs;Imre Lahdelma;Tuomas Eerola;アーサーズ裕子;吉永 朋矢;神庭 有花
- 通讯作者:神庭 有花
運指と運弓を反映した音響信号からのヴァイオリン演奏アニメーションの自動生成
根据反映指法和弓法的声学信号自动生成小提琴演奏动画
- DOI:
- 发表时间:2022
- 期刊:
- 影响因子:0
- 作者:Yuko Arthurs;Imre Lahdelma;Tuomas Eerola;アーサーズ裕子;吉永 朋矢;神庭 有花;柏木 爽良;Keitaro Tanaka;Asuka Hirata;平田 明日香
- 通讯作者:平田 明日香
動画内話者の音声強調における特定背景音声の透過
增强视频中讲话者的声音时特定背景音频的透明度
- DOI:
- 发表时间:2023
- 期刊:
- 影响因子:0
- 作者:Yuko Arthurs;Imre Lahdelma;Tuomas Eerola;アーサーズ裕子;吉永 朋矢
- 通讯作者:吉永 朋矢
口パク動画の発話内容推測における距離学習に基づく精度向上手法の検討
基于远程学习的口型同步视频言语内容估计精度改进方法检验
- DOI:
- 发表时间:2022
- 期刊:
- 影响因子:0
- 作者:Okita;T.; Aida;K.; Tanaka;K.; Ota;E.; Yamaguchi;J.;柏木 爽良
- 通讯作者:柏木 爽良
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
田中 啓太郎其他文献
スペクトログラムとピッチグラムの深層クラスタリングに基づく複数楽器パート採譜
基于声谱图和音调图深度聚类的多乐器声部转录
- DOI:
- 发表时间:
2020 - 期刊:
- 影响因子:0
- 作者:
田中 啓太郎;中塚 貴之;錦見 亮;吉井 和佳;森島 繁生 - 通讯作者:
森島 繁生
高発光性示す凝集誘起型有機蛍光分子の開発
具有高发光特性的聚集诱导有机荧光分子的开发
- DOI:
- 发表时间:
2023 - 期刊:
- 影响因子:0
- 作者:
萩森 政頼;原 史子;吉田 達貞;小川 由起子;田中 啓太郎 - 通讯作者:
田中 啓太郎
ルイス酸フリーのFriedel-Craftsアシル化反応の開発
无路易斯酸傅克酰化反应的发展
- DOI:
- 发表时间:
2012 - 期刊:
- 影响因子:0
- 作者:
濱崎 翔平;萩森 政頼;田中 啓太郎;山口 泰史 - 通讯作者:
山口 泰史
深層クラスタリングを用いた任意楽器パートの自動採譜
使用深度聚类自动转录任意仪器部件
- DOI:
- 发表时间:
2020 - 期刊:
- 影响因子:0
- 作者:
田中 啓太郎;中塚 貴之;錦見 亮;吉井 和佳;森島 繁生 - 通讯作者:
森島 繁生
田中 啓太郎的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
相似海外基金
形式言語理論に基づく自動採譜
基于形式语言理论的自动转录
- 批准号:
23K20392 - 财政年份:2024
- 资助金额:
$ 1.6万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
難曲津軽三味線民謡(じょんがら節)の構成音素解明と高精度自動採譜手法に関する研究
津轻三味线疑难民歌构成音素解析及高精度自动转写方法研究
- 批准号:
21K11983 - 财政年份:2021
- 资助金额:
$ 1.6万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Automatic transcription based on formal language theory
基于形式语言理论的自动转录
- 批准号:
20H04302 - 财政年份:2020
- 资助金额:
$ 1.6万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
深層ベイズ学習に基づく歌声の認識と生成の統一理論
基于深度贝叶斯学习的歌声识别与生成统一理论
- 批准号:
19J15255 - 财政年份:2019
- 资助金额:
$ 1.6万 - 项目类别:
Grant-in-Aid for JSPS Fellows
Audio-Visual Music Understanding Based on Integration of Recognition and Generative Processes
基于识别和生成过程整合的视听音乐理解
- 批准号:
19H04137 - 财政年份:2019
- 资助金额:
$ 1.6万 - 项目类别:
Grant-in-Aid for Scientific Research (B)