Machine learning algorithms for analyzing auditory scenes with multiple sound sources
用于分析具有多个声源的听觉场景的机器学习算法
基本信息
- 批准号:0535251
- 负责人:
- 金额:--
- 依托单位:
- 依托单位国家:美国
- 项目类别:Continuing Grant
- 财政年份:2006
- 资助国家:美国
- 起止时间:2006-01-01 至 2009-12-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
Computer algorithms that analyze auditory scenes and extract individual sound sources would have a strong impact in several domains. For example, to facilitate natural interaction with computing devices by voice, an automatic speech recognition system must be able to focus on the voice of the person speaking to it and ignore sounds from all other sources. A hearing device must perform a similar task to allow a hearing impaired person conduct a conversation in a noisy, multiple source environment. Building on recent advances in the fields of machine learning and signal processing, we are developing sophisticated adaptive algorithms for analyzing auditory scenes with multiple sound sources. Our algorithms are based on probabilistic modeling of different sound sources and of the manner in which they overlap each other and distorted by reverberation and background noise. We use advanced recent techniques for inferring our models from sound data captured by a microphone array, separating those data into individual sources, and automatically determining the type of each source present and its location. Moreover, by reconstructing the clean signal of individual sound sources, we dramatically enhance the accuracy of automatic speech recognition for human speakers in multiple source environments. To facilitate the development and evaluation of our algorithms, and also to encourage competition between other research groups ultimately resulting in improved techniques, we collect a large dataset of multiple source auditory scenes, and make it publicly available on a dedicated website.
分析听觉场景并提取单个声源的计算机算法将在多个领域产生重大影响。例如,为了促进通过语音与计算设备的自然交互,自动语音识别系统必须能够专注于对它说话的人的语音,而忽略来自所有其他来源的声音。听力设备必须执行类似的任务,以允许听力受损的人在嘈杂的多源环境中进行对话。基于机器学习和信号处理领域的最新进展,我们正在开发复杂的自适应算法,用于分析具有多个声源的听觉场景。我们的算法是基于不同的声源的概率建模和它们相互重叠的方式,并通过混响和背景噪声失真。我们使用先进的最新技术从麦克风阵列捕获的声音数据中推断我们的模型,将这些数据分离为单个源,并自动确定每个源的类型及其位置。此外,通过重构单个声源的干净信号,我们大大提高了多源环境中说话人自动语音识别的准确性。为了促进我们算法的开发和评估,也为了鼓励其他研究小组之间的竞争,最终导致技术的改进,我们收集了一个大型的多源听觉场景数据集,并在一个专门的网站上公开提供。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Terrence Sejnowski其他文献
Activity dependent modulation of synaptic transmission by presynaptic calcium stores: A dichotomy of short-term depression and facilitation
- DOI:
10.1186/1471-2202-14-s1-p351 - 发表时间:
2013-07-08 - 期刊:
- 影响因子:2.300
- 作者:
Suhita Nadkarni;Thomas Bartol;Herbert Levine;Terrence Sejnowski - 通讯作者:
Terrence Sejnowski
MCell Model of Presynaptic Calcium Dynamics Predicts the Structural Correlates of Short-term Synaptic Plasticity
- DOI:
10.1016/j.bpj.2008.12.3482 - 发表时间:
2009-02-01 - 期刊:
- 影响因子:
- 作者:
Suhita Nadkarni;Thomas Bartol;Terrence Sejnowski;Hebert Levine - 通讯作者:
Hebert Levine
1. How Are Memories Consolidated During Sleep and Why Do We Dream?
- DOI:
10.1016/j.biopsych.2017.02.012 - 发表时间:
2017-05-15 - 期刊:
- 影响因子:
- 作者:
Terrence Sejnowski - 通讯作者:
Terrence Sejnowski
The effects of audiovisual inputs on solving the cocktail party problem in the human brain: An fMRI study
- DOI:
DOI: 10.1093/cercor/bhx235 - 发表时间:
2018 - 期刊:
- 影响因子:
- 作者:
Yuanqing Li;Fangyi Wang;Yongbin Chen;Andrzej Cichocki;Terrence Sejnowski - 通讯作者:
Terrence Sejnowski
Terrence Sejnowski的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Terrence Sejnowski', 18)}}的其他基金
NCS-FO: Collaborative Research: Computational Analysis of Synaptic Nanodomains
NCS-FO:协作研究:突触纳米域的计算分析
- 批准号:
2219979 - 财政年份:2022
- 资助金额:
-- - 项目类别:
Standard Grant
NeuroNex Research Program Workshop, San Diego, California, November 7-8, 2018
NeuroNex 研究计划研讨会,加利福尼亚州圣地亚哥,2018 年 11 月 7-8 日
- 批准号:
1901715 - 财政年份:2019
- 资助金额:
-- - 项目类别:
Standard Grant
NCS-FO: Collaborative Research: Integrative Foundations for Interactions of Complex Neural and Neuro-Inspired Systems with Realistic Environments
NCS-FO:协作研究:复杂神经和神经启发系统与现实环境相互作用的综合基础
- 批准号:
1735004 - 财政年份:2017
- 资助金额:
-- - 项目类别:
Standard Grant
EAGER: Collaborative Research: Non-Local Cortical Computation and Enhanced Learning with Astrocytes
EAGER:协作研究:非局部皮质计算和星形胶质细胞增强学习
- 批准号:
1344471 - 财政年份:2013
- 资助金额:
-- - 项目类别:
Standard Grant
Active Visual Depth Perception by Looming
Looming 的主动视觉深度感知
- 批准号:
0096790 - 财政年份:2001
- 资助金额:
-- - 项目类别:
Standard Grant
IGERT Full Proposal: Computational Neurobiology Graduate Program
IGERT 完整提案:计算神经生物学研究生项目
- 批准号:
9987614 - 财政年份:2000
- 资助金额:
-- - 项目类别:
Continuing Grant
General Monte Carlo Computer Simulation of Subcellular Biochemical Signaling: Phase II
亚细胞生化信号转导的通用蒙特卡罗计算机模拟:第二阶段
- 批准号:
9985964 - 财政年份:2000
- 资助金额:
-- - 项目类别:
Continuing Grant
Active Visual Depth Perception by Looming
Looming 的主动视觉深度感知
- 批准号:
9975048 - 财政年份:1999
- 资助金额:
-- - 项目类别:
Standard Grant
General Monte Carlo Computer Simulation of Subcellular Biochemical Signaling
亚细胞生化信号转导的通用蒙特卡罗计算机模拟
- 批准号:
9603611 - 财政年份:1997
- 资助金额:
-- - 项目类别:
Continuing Grant
Workshop on Neuromorphic Engineering; June 25, 1995 - July 8, 1995; Telluride, Colorado
神经形态工程研讨会;
- 批准号:
9511637 - 财政年份:1995
- 资助金额:
-- - 项目类别:
Continuing Grant
相似国自然基金
Scalable Learning and Optimization: High-dimensional Models and Online Decision-Making Strategies for Big Data Analysis
- 批准号:
- 批准年份:2024
- 资助金额:万元
- 项目类别:合作创新研究团队
Understanding structural evolution of galaxies with machine learning
- 批准号:n/a
- 批准年份:2022
- 资助金额:10.0 万元
- 项目类别:省市级项目
煤矿安全人机混合群智感知任务的约束动态多目标Q-learning进化分配
- 批准号:
- 批准年份:2022
- 资助金额:30 万元
- 项目类别:青年科学基金项目
基于领弹失效考量的智能弹药编队短时在线Q-learning协同控制机理
- 批准号:62003314
- 批准年份:2020
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
集成上下文张量分解的e-learning资源推荐方法研究
- 批准号:61902016
- 批准年份:2019
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
儿童音乐能力发展对语言与社会认知能力及脑发育的影响
- 批准号:31971003
- 批准年份:2019
- 资助金额:58.0 万元
- 项目类别:面上项目
具有时序迁移能力的Spiking-Transfer learning (脉冲-迁移学习)方法研究
- 批准号:61806040
- 批准年份:2018
- 资助金额:20.0 万元
- 项目类别:青年科学基金项目
基于Deep-learning的三江源区冰川监测动态识别技术研究
- 批准号:51769027
- 批准年份:2017
- 资助金额:38.0 万元
- 项目类别:地区科学基金项目
多场景网络学习中基于行为-情感-主题联合建模的学习者兴趣挖掘关键技术研究
- 批准号:61702207
- 批准年份:2017
- 资助金额:21.0 万元
- 项目类别:青年科学基金项目
基于异构医学影像数据的深度挖掘技术及中枢神经系统重大疾病的精准预测
- 批准号:61672236
- 批准年份:2016
- 资助金额:64.0 万元
- 项目类别:面上项目
相似海外基金
DMS-EPSRC: Asymptotic Analysis of Online Training Algorithms in Machine Learning: Recurrent, Graphical, and Deep Neural Networks
DMS-EPSRC:机器学习中在线训练算法的渐近分析:循环、图形和深度神经网络
- 批准号:
EP/Y029089/1 - 财政年份:2024
- 资助金额:
-- - 项目类别:
Research Grant
CAREER: Blessing of Nonconvexity in Machine Learning - Landscape Analysis and Efficient Algorithms
职业:机器学习中非凸性的祝福 - 景观分析和高效算法
- 批准号:
2337776 - 财政年份:2024
- 资助金额:
-- - 项目类别:
Continuing Grant
Collaborative Research: AF: Medium: Algorithms Meet Machine Learning: Mitigating Uncertainty in Optimization
协作研究:AF:媒介:算法遇见机器学习:减轻优化中的不确定性
- 批准号:
2422926 - 财政年份:2024
- 资助金额:
-- - 项目类别:
Continuing Grant
CAREER: Gaussian Processes for Scientific Machine Learning: Theoretical Analysis and Computational Algorithms
职业:科学机器学习的高斯过程:理论分析和计算算法
- 批准号:
2337678 - 财政年份:2024
- 资助金额:
-- - 项目类别:
Continuing Grant
XTRIPODS: Algorithms and Machine Learning in Data Intensive Models
XTRIPODS:数据密集型模型中的算法和机器学习
- 批准号:
2342527 - 财政年份:2024
- 资助金额:
-- - 项目类别:
Standard Grant
AF:RI:Small: Fairness in allocation and machine learning problems: algorithms and solution concepts
AF:RI:Small:分配公平性和机器学习问题:算法和解决方案概念
- 批准号:
2334461 - 财政年份:2024
- 资助金额:
-- - 项目类别:
Standard Grant
STINMALE: Strategic Interactions with Machine-Learning Algorithms: The Role of Simple Beliefs
STINMALE:与机器学习算法的战略交互:简单信念的作用
- 批准号:
EP/Y033361/1 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Research Grant
CAREER: Interpretable and Robust Machine Learning Models: Analysis and Algorithms
职业:可解释且稳健的机器学习模型:分析和算法
- 批准号:
2239787 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Continuing Grant
Next-Generation Algorithms in Statistical Genetics Based on Modern Machine Learning
基于现代机器学习的下一代统计遗传学算法
- 批准号:
10714930 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Customizable Artificial Intelligence for the Biomedical Masses: Development of a User-Friendly Automated Machine Learning Platform for Biology Image Analysis.
面向生物医学大众的可定制人工智能:开发用于生物图像分析的用户友好的自动化机器学习平台。
- 批准号:
10699828 - 财政年份:2023
- 资助金额:
-- - 项目类别: