CHS: Small: Robust Interactive Audio Source Separation

CHS:小型:强大的交互式音频源分离

基本信息

  • 批准号:
    1420971
  • 负责人:
  • 金额:
    $ 49.87万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2014
  • 资助国家:
    美国
  • 起止时间:
    2014-10-01 至 2018-09-30
  • 项目状态:
    已结题

项目摘要

Algorithms to separate audio sources have many potential uses such as to extract important audio data from historic recordings or to help people with hearing impairments select what to amplify and what to suppress in their hearing aids. Computer processing of audio content can potentially be used to isolate the sound sources of interest and to improve the audio clarity any time that the content exhibits interference from multiple sound sources, such as to extract a single voice of interest from a room full of voices. However, current sound source identification and separation methods are only reliable when there is a single predominant sound. This project will develop the science and technology that is needed to more easily isolate a single sound source from audio content with multiple competing sources, and that is needed to build interactive computer systems that will guide users though an interactive source separation process, to permit the separation and recombining of sound sources in a manner that is beyond the reach of existing audio software. The outcomes of the project will improve the possibility of speech recognition in environments with multiple talkers, will be useful for many scientific inquiries such as in biodiversity monitoring through the automated analysis of field recordings, and will be broadly useful any time that manual tagging of audio data is not practical.While many computational auditory scene analysis algorithms have been proposed to separate audio scenes into individual sources, current methods are brittle and difficult to use and as a result have not been broadly adopted by potential users. The methods are brittle in that each algorithm relies on a single cue to separate sources and if the cue is not reliable then the method fails. The methods are difficult to use because the algorithms cannot predict which audio scenes any specific algorithm is likely to work on, and so the user does not know which method to apply in any given case. They are also difficult to use because their control parameters are hard to understand for users who lack expertise in signal processing. This project will research how to integrate multiple source separation algorithms into a single framework, and how to improve the ease of use by exploring interfaces that permit users to interactively define what they wish to isolate in audio scenes, and that permit systems to provide users with guidance on selecting a tool and setting the necessary parameters. The project will produce an open-source audio source separation tool that embodies these scientific research outcomes.
分离音频源的算法有许多潜在的用途,例如从历史记录中提取重要的音频数据,或帮助听力受损的人选择在助听器中放大和抑制哪些内容。音频内容的计算机处理可以潜在地用于隔离感兴趣的声源并在内容显示来自多个声源的干扰时提高音频清晰度,例如从充满声音的房间中提取单个感兴趣的声音。然而,目前的声源识别和分离方法只有在存在单一主导音时才可靠。该项目将发展科学和技术,以便更容易地从具有多个竞争源的音频内容中分离出单个声源,并且需要建立交互式计算机系统,该系统将指导用户通过交互式声源分离过程,允许以现有音频软件无法达到的方式分离和重新组合声源。该项目的成果将提高在有多人说话的环境中语音识别的可能性,将对许多科学调查有用,例如通过对现场录音的自动分析进行生物多样性监测,并且在手动标记音频数据不实际的任何时候都将广泛有用。虽然已经提出了许多计算听觉场景分析算法来将音频场景分离为单个源,但目前的方法很脆弱且难以使用,因此没有被潜在用户广泛采用。这些方法很脆弱,因为每个算法都依赖于单个线索来分离源,如果线索不可靠,那么方法就会失败。这些方法很难使用,因为算法无法预测任何特定算法可能处理的音频场景,因此用户不知道在任何给定情况下应用哪种方法。它们也很难使用,因为它们的控制参数对于缺乏信号处理专业知识的用户来说很难理解。该项目将研究如何将多个源分离算法集成到单个框架中,以及如何通过探索允许用户交互定义他们希望在音频场景中隔离的内容的接口来提高易用性,并允许系统为用户提供选择工具和设置必要参数的指导。本项目将制作一个体现这些科研成果的开源音频源分离工具。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Bryan Pardo其他文献

Multi-Resolution Common Fate Transform
多分辨率共同命运变换
Harmonic/percussive separation using Kernel Additive Modelling
使用核加性建模进行谐波/冲击分离
  • DOI:
    10.1049/cp.2014.0655
  • 发表时间:
    2014
  • 期刊:
  • 影响因子:
    0
  • 作者:
    D. Fitzgerald;Antoine Liukus;Z. Rafii;Bryan Pardo;L. Daudet
  • 通讯作者:
    L. Daudet
HaptEQ: A Collaborative Tool For Visually Impaired Audio Producers
HaptEQ:视障音频制作人的协作工具
Rapid Learning of Subjective Preference in Equalization
均衡主观偏好的快速学习
  • DOI:
  • 发表时间:
    2008
  • 期刊:
  • 影响因子:
    0
  • 作者:
    A. Sabin;Bryan Pardo
  • 通讯作者:
    Bryan Pardo
Vocal Imitation Set: a dataset of vocally imitated sound events using the AudioSet ontology
声音模仿集:使用 AudioSet 本体的声音模仿声音事件的数据集
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    B. Kim;Madhav Ghei;Bryan Pardo;Z. Duan
  • 通讯作者:
    Z. Duan

Bryan Pardo的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Bryan Pardo', 18)}}的其他基金

Collaborative Research: Engaging Blind and Visually Impaired Youth in Computer Science through Music Programming
合作研究:通过音乐编程让盲人和视障青少年参与计算机科学
  • 批准号:
    2300633
  • 财政年份:
    2023
  • 资助金额:
    $ 49.87万
  • 项目类别:
    Standard Grant
Collaborative Research: FW-HTF-R: Toward an Ecosystem of Artificial-intelligence-powered Music Production (TEAMuP)
合作研究:FW-HTF-R:迈向人工智能驱动的音乐制作生态系统 (TEAMuP)
  • 批准号:
    2222369
  • 财政年份:
    2022
  • 资助金额:
    $ 49.87万
  • 项目类别:
    Standard Grant
III: Small: Collaborative Research: Algorithms for Query by Example of Audio Databases
III:小:协作研究:以音频数据库为例的查询算法
  • 批准号:
    1617497
  • 财政年份:
    2016
  • 资助金额:
    $ 49.87万
  • 项目类别:
    Standard Grant
HCC: Small: Building Audio Interfaces with Crowdsourced Concept Maps and Active Transfer Learning
HCC:小型:使用众包概念图和主动迁移学习构建音频接口
  • 批准号:
    1116384
  • 财政年份:
    2011
  • 资助金额:
    $ 49.87万
  • 项目类别:
    Standard Grant
III-COR-Small: Bootstrapping Adaptive Personalized Music Search with Game-based Collaborative Tagging
III-COR-Small:通过基于游戏的协作标记引导自适应个性化音乐搜索
  • 批准号:
    0812314
  • 财政年份:
    2008
  • 资助金额:
    $ 49.87万
  • 项目类别:
    Standard Grant
Collaborative Research: Pilot: Personalized Tools to Enhance Musical Creativity
合作研究:试点:增强音乐创造力的个性化工具
  • 批准号:
    0757544
  • 财政年份:
    2008
  • 资助金额:
    $ 49.87万
  • 项目类别:
    Standard Grant
CAREER: Making music documents accessible in musical terms
职业:以音乐术语制作音乐文档
  • 批准号:
    0643752
  • 财政年份:
    2007
  • 资助金额:
    $ 49.87万
  • 项目类别:
    Continuing Grant

相似国自然基金

基于小胶质细胞-神经元通讯的线粒体自噬调控在癫痫中的作用及虎杖苷干预研究
  • 批准号:
    JCZRYB202501348
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
SK4促进EAT巨噬细胞外泌体cfa-miR-22e分泌在房颤犬海马小胶质细胞极化中的作用机制研究
  • 批准号:
    JCZRYB202501409
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
基于PROTAC技术靶向EFTUD2小分子降解剂设计和结构优化与抗肺癌活性研究
  • 批准号:
    JCZRYB202501469
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
基于AMPK/mTOR/TFEB通路介导自噬探讨电针对AD小鼠小胶质细胞线粒体功能及认知障碍的作用机制
  • 批准号:
    JCZRLH202500363
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
单细胞测序解析Itgb2促进小胶质细胞活化加剧神经节细胞损伤机制及其在视网膜动脉阻塞中的临床应用
  • 批准号:
    JCZRQN202500827
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
利用纳米离子探针对小尺寸纳米纤维素晶杀伤鳞癌的机制研究
  • 批准号:
    JCZRYB202500324
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
治疗呼吸道合胞病毒(RSV)感染的小分子创新药临床前研究
  • 批准号:
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
小胶质细胞通过FABP5/LXR/SREBP1轴介导的吞噬功能障碍加剧阿尔茨海默病Aβ病理的机制研究
  • 批准号:
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
基于多重时序液滴数字CRISPR的肺癌单个小细胞外囊泡miRNAs多靶标灵敏检测新方法研究
  • 批准号:
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
基于小目标检测与DeepSeek大模型的智能医学检测及诊疗研究
  • 批准号:
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目

相似海外基金

CNS Core: Small: Toward Opportunistic, Fast, and Robust In-Cache AI Acceleration at the Edge
CNS 核心:小型:在边缘实现机会主义、快速且稳健的缓存内 AI 加速
  • 批准号:
    2228028
  • 财政年份:
    2023
  • 资助金额:
    $ 49.87万
  • 项目类别:
    Standard Grant
SaTC: CORE: Small: Robust and Private Federated Analytics on Networked Data
SaTC:核心:小型:网络数据的稳健且私密的联合分析
  • 批准号:
    2241100
  • 财政年份:
    2023
  • 资助金额:
    $ 49.87万
  • 项目类别:
    Standard Grant
SHF: Small: Software and Hardware Support for Robust Deep Learning
SHF:小型:强大深度学习的软件和硬件支持
  • 批准号:
    2301334
  • 财政年份:
    2023
  • 资助金额:
    $ 49.87万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Small: Efficient and Robust Multi-model Data Analytics for Edge Computing
协作研究:III:小型:边缘计算的高效、稳健的多模型数据分析
  • 批准号:
    2311596
  • 财政年份:
    2023
  • 资助金额:
    $ 49.87万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Small: Efficient and Robust Multi-model Data Analytics for Edge Computing
协作研究:III:小型:边缘计算的高效、稳健的多模型数据分析
  • 批准号:
    2311598
  • 财政年份:
    2023
  • 资助金额:
    $ 49.87万
  • 项目类别:
    Standard Grant
Collaborative Research: SaTC: CORE: Small: Critical Learning Periods Augmented Robust Federated Learning
协作研究:SaTC:核心:小型:关键学习期增强鲁棒联邦学习
  • 批准号:
    2315613
  • 财政年份:
    2023
  • 资助金额:
    $ 49.87万
  • 项目类别:
    Standard Grant
Collaborative Research: SaTC: CORE: Small: Critical Learning Periods Augmented Robust Federated Learning
协作研究:SaTC:核心:小型:关键学习期增强鲁棒联邦学习
  • 批准号:
    2315612
  • 财政年份:
    2023
  • 资助金额:
    $ 49.87万
  • 项目类别:
    Standard Grant
Collaborative Research: SaTC: CORE: Small: Towards Robust, Scalable, and Resilient Radio Fingerprinting
协作研究:SaTC:核心:小型:迈向稳健、可扩展和有弹性的无线电指纹识别
  • 批准号:
    2225161
  • 财政年份:
    2023
  • 资助金额:
    $ 49.87万
  • 项目类别:
    Standard Grant
Robust and Efficient Learning of High-Resolution Brain MRI Reconstruction from Small Referenceless Data
从小型无参考数据中稳健而高效地学习高分辨率脑 MRI 重建
  • 批准号:
    10584324
  • 财政年份:
    2023
  • 资助金额:
    $ 49.87万
  • 项目类别:
Collaborative Research: CIF: Small: Robust Machine Learning under Sparse Adversarial Attacks
协作研究:CIF:小型:稀疏对抗攻击下的鲁棒机器学习
  • 批准号:
    2236484
  • 财政年份:
    2023
  • 资助金额:
    $ 49.87万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了