Deep Learning Systems for Musical Audio Generation

用于音乐音频生成的深度学习系统

基本信息

  • 批准号:
    RGPIN-2020-05968
  • 负责人:
  • 金额:
    $ 2.11万
  • 依托单位:
  • 依托单位国家:
    加拿大
  • 项目类别:
    Discovery Grants Program - Individual
  • 财政年份:
    2022
  • 资助国家:
    加拿大
  • 起止时间:
    2022-01-01 至 2023-12-31
  • 项目状态:
    已结题

项目摘要

Imagine you are creating a soundtrack for a video, and you have a machine learning (ML)-driven music creation tool/assistant. Your ML assistant can generate sounds and musical clips, but there is a problem:it can neither follow instructions, nor figure out what needs to be done. For an assistant to be helpful to humans, there must be a way to direct what it does and how it does it. My research programme is concerned with ML in the sphere of audio and music generation, and this proposal is concerned with imbuing generative models for music and audio with powerful controls (e.g. to allow effective ML-based tools). Specifically, I plan to explore this in two main musical contexts: (1) generating sequences of distinct notes (e.g. keypresses on a piano), and (2) generating raw audio files, i.e. soundwaves, one "measurement" at a time (where the lowest-quality sounds have at least 16,000 such measurements per second). Finely controlling generation in these domains is hard for reasons including:   (1) Our vocabulary to describe sounds is limited and ill-defined. We can hear that this violin sounds "richer" than that one, or that this speech has a "more articulated rhythm" than that one, but we may not know how to quantify these qualities.   (2) Most data does not come with these labels. The ML challenges implied by these difficulties are fundamental ones: learning underlying structure in large, minimally labelled datasets of extremely long sequences. So how do we approach the task of control? We first notice what people do: a teacher tells a student, "play it this way," providing a related example; that single example becomes immediately helpful, since the student already has a wordless mental map of sounds, and the example becomes an analogy that points to a spot on that map. I want to find techniques to allow control over generative models in such ways. This involves: (I) Learning good maps (~disentangled latent representations) of sound. For example, moving along one direction might mean more rhythmic in some way. (II) Learning these from mainly unlabelled data, making effective use of rare labelled examples (~semi-supervised learning). This is important because:  1) Some ML problems inherent to this problem are fundamental, so their solutions will be fundamental as well.  2) Controlling generative models can allow them to be helpful..   ..to artists, as they will provide effective creativity support to the creative economy.   ..to amateur musicians, because such tools can easily have great educational value.   ..to health. Rhythmic music can help motor rehabilitation; imagine a tireless and adaptive music generator designed specifically for rehabilitation. Psychiatric diagnoses are sometimes based on non-verbal speech qualities; imagine controlling speech generation by examples: "use a voice like Person A, with an accent like Person B, and with the prosody of Person C." and in doing so, helping training and removing potential bias effects.
想象一下,您正在为视频创建配乐,并且您有一个机器学习 (ML) 驱动的音乐创作工具/助手。你的机器学习助手可以生成声音和音乐片段,但有一个问题:它既不能遵循指令,也不能弄清楚需要做什么。为了让助手对人类有所帮助,必须有一种方法来指导它做什么以及如何做。我的研究项目涉及音频和音乐生成领域的机器学习,该提案涉及为音乐和音频的生成模型注入强大的控制(例如,允许有效的基于机器学习的工具)。具体来说,我计划在两个主要的音乐环境中对此进行探索:(1) 生成不同音符的序列(例如钢琴上的按键),以及 (2) 生成原始音频文件,即声波,一次一个“测量”(最低质量的声音每秒至少有 16,000 个这样的测量)。精细控制这些领域的生成很困难,原因包括:(1)我们描述声音的词汇有限且定义不明确。我们可以听到这把小提琴听起来比那把“更丰富”,或者这段演讲比那把“更有清晰的节奏”,但我们可能不知道如何量化这些品质。   (2) 大多数数据不带有这些标签。这些困难所隐含的机器学习挑战是根本性的:在极长序列的大型、标记最少的数据集中学习底层结构。那么我们如何完成控制任务呢?我们首先注意到人们的做法:老师告诉学生“这样玩”,并提供一个相关的例子;这个单一的例子立即变得有帮助,因为学生已经有了一张无言的声音心理地图,并且这个例子变成了指向该地图上的一个点的类比。我想找到能够以这种方式控制生成模型的技术。这涉及:(I)学习良好的声音地图(~解开的潜在表征)。例如,沿着一个方向移动可能意味着在某种程度上更有节奏。 (II)主要从未标记的数据中学习这些数据,有效利用罕见的标记示例(~半监督学习)。这很重要,因为:1)这个问题固有的一些机器学习问题是根本性的,因此它们的解决方案也将是根本性的。  2) 控制生成模型可以让它们对艺术家有所帮助,因为它们将为创意经济提供有效的创意支持。   ..对于业余音乐家来说,因为这样的工具很容易具有很大的教育价值。   ..为了健康。有节奏的音乐可以帮助运动康复;想象一下专为康复设计的不知疲倦且自适应的音乐发生器。精神病学诊断有时基于非语言的言语质量;想象一下通过示例控制语音生成:“使用像 A 一样的声音,像 B 一样的口音,以及 C 一样的韵律。”并在此过程中帮助培训和消除潜在的偏见影响。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Oore, Sageev其他文献

Uniform strength for large deflections of cantilever beams under end point load
This time with feeling: learning expressive musical performance
  • DOI:
    10.1007/s00521-018-3758-9
  • 发表时间:
    2020-02-01
  • 期刊:
  • 影响因子:
    6
  • 作者:
    Oore, Sageev;Simon, Ian;Simonyan, Karen
  • 通讯作者:
    Simonyan, Karen

Oore, Sageev的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Oore, Sageev', 18)}}的其他基金

Controlling Generative Musical Systems: Getting the Right Data & Using the Right Instrument
控制生成音乐系统:获取正确的数据
  • 批准号:
    RTI-2023-00594
  • 财政年份:
    2022
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Research Tools and Instruments
Deep Learning Systems for Musical Audio Generation
用于音乐音频生成的深度学习系统
  • 批准号:
    RGPIN-2020-05968
  • 财政年份:
    2021
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Discovery Grants Program - Individual
Deep Learning Systems for Musical Audio Generation
用于音乐音频生成的深度学习系统
  • 批准号:
    RGPIN-2020-05968
  • 财政年份:
    2020
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Discovery Grants Program - Individual
Adaptive high degree-of-freedom interaction techniques
自适应高自由度交互技术
  • 批准号:
    298224-2007
  • 财政年份:
    2013
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Discovery Grants Program - Individual
Adaptive high degree-of-freedom interaction techniques
自适应高自由度交互技术
  • 批准号:
    298224-2007
  • 财政年份:
    2010
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Discovery Grants Program - Individual
Adaptive high degree-of-freedom interaction techniques
自适应高自由度交互技术
  • 批准号:
    298224-2007
  • 财政年份:
    2009
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Discovery Grants Program - Individual
Adaptive high degree-of-freedom interaction techniques
自适应高自由度交互技术
  • 批准号:
    298224-2007
  • 财政年份:
    2008
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Discovery Grants Program - Individual
Adaptive high degree-of-freedom interaction techniques
自适应高自由度交互技术
  • 批准号:
    298224-2007
  • 财政年份:
    2007
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Discovery Grants Program - Individual
Interactive tools for computer animation
计算机动画交互工具
  • 批准号:
    298224-2004
  • 财政年份:
    2006
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Discovery Grants Program - Individual
Interactive tools for computer animation
计算机动画交互工具
  • 批准号:
    298224-2004
  • 财政年份:
    2005
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Discovery Grants Program - Individual

相似国自然基金

Scalable Learning and Optimization: High-dimensional Models and Online Decision-Making Strategies for Big Data Analysis
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    万元
  • 项目类别:
    合作创新研究团队
Understanding structural evolution of galaxies with machine learning
  • 批准号:
    n/a
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
煤矿安全人机混合群智感知任务的约束动态多目标Q-learning进化分配
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于领弹失效考量的智能弹药编队短时在线Q-learning协同控制机理
  • 批准号:
    62003314
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
集成上下文张量分解的e-learning资源推荐方法研究
  • 批准号:
    61902016
  • 批准年份:
    2019
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
具有时序迁移能力的Spiking-Transfer learning (脉冲-迁移学习)方法研究
  • 批准号:
    61806040
  • 批准年份:
    2018
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
基于Deep-learning的三江源区冰川监测动态识别技术研究
  • 批准号:
    51769027
  • 批准年份:
    2017
  • 资助金额:
    38.0 万元
  • 项目类别:
    地区科学基金项目
具有时序处理能力的Spiking-Deep Learning(脉冲深度学习)方法研究
  • 批准号:
    61573081
  • 批准年份:
    2015
  • 资助金额:
    64.0 万元
  • 项目类别:
    面上项目
基于有向超图的大型个性化e-learning学习过程模型的自动生成与优化
  • 批准号:
    61572533
  • 批准年份:
    2015
  • 资助金额:
    66.0 万元
  • 项目类别:
    面上项目
E-Learning中学习者情感补偿方法的研究
  • 批准号:
    61402392
  • 批准年份:
    2014
  • 资助金额:
    26.0 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

CAREER: Adaptive Deep Learning Systems Towards Edge Intelligence
职业:迈向边缘智能的自适应深度学习系统
  • 批准号:
    2338512
  • 财政年份:
    2024
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Continuing Grant
SHF: Small: Hardware-Software Co-design for Privacy Protection on Deep Learning-based Recommendation Systems
SHF:小型:基于深度学习的推荐系统的隐私保护软硬件协同设计
  • 批准号:
    2334628
  • 财政年份:
    2024
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Standard Grant
Decision-Embedded Deep Learning for Transit Systems
交通系统决策嵌入式深度学习
  • 批准号:
    2409847
  • 财政年份:
    2024
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Standard Grant
CAREER: Protecting Deep Learning Systems against Hardware-Oriented Vulnerabilities
职业:保护深度学习系统免受面向硬件的漏洞的影响
  • 批准号:
    2426299
  • 财政年份:
    2024
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Continuing Grant
Collaborative Research: RI: Small: Deep Constrained Learning for Power Systems
合作研究:RI:小型:电力系统的深度约束学习
  • 批准号:
    2345528
  • 财政年份:
    2023
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Standard Grant
Research on Stream Processing Systems Enhanced by Deep Learning
深度学习增强的流处理系统研究
  • 批准号:
    23K16888
  • 财政年份:
    2023
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
Collaborative Research: III: Medium: VirtualLab: Integrating Deep Graph Learning and Causal Inference for Multi-Agent Dynamical Systems
协作研究:III:媒介:VirtualLab:集成多智能体动态系统的深度图学习和因果推理
  • 批准号:
    2312501
  • 财政年份:
    2023
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Standard Grant
CRII: CNS: Exploring Data and Model Sparsity in Deep Learning Systems using Graphs
CRII:CNS:使用图探索深度学习系统中的数据和模型稀疏性
  • 批准号:
    2245849
  • 财政年份:
    2023
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Medium: VirtualLab: Integrating Deep Graph Learning and Causal Inference for Multi-Agent Dynamical Systems
协作研究:III:媒介:VirtualLab:集成多智能体动态系统的深度图学习和因果推理
  • 批准号:
    2312502
  • 财政年份:
    2023
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Standard Grant
Collaborative Research: CyberTraining: Pilot: Research Workforce Development for Deep Learning Systems in Advanced GPU Cyberinfrastructure
协作研究:网络培训:试点:高级 GPU 网络基础设施中深度学习系统的研究人员开发
  • 批准号:
    2330364
  • 财政年份:
    2023
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了