A study on signal extraction in noisy and reverberant environment

噪声混响环境下信号提取的研究

基本信息

项目摘要

This research discusses models of speech enhancement and segregation based on knowledge about human psychoacoustics and auditory physiology. The cancellation model is used for enhancing speech. Special attention is paid to reducing noise by using a spatial filtering technique, and increasing the robustness of fundamental frequency estimation by using a frequency filtering technique. Both techniques adopt concepts of the cancellation model. In addition, some constraints related to the heuristic regularities proposed by Bregman are used to overcome the problem associated with segregating two acoustic sources. Simulated results show that both spatial and frequency filtering are useful in enhancing speech. As a result, these filtering methods can be used effectively at the front-end of automatic speech recognition systems, and for speech feature extraction. The sound segregation model can precisely extract a desired signal from a noisy signal even in waveforms.Additionally, this research discusses models of sound source direction estimation based on physiological data of mammal audition. The model can explain the relationship between transmission of temporal and phase information by nerve firing and accuracy of interaural time differences.
这项研究讨论了基于人类心理声学和听觉生理学知识的语音增强和隔离模型。消除模型用于增强语音。特别注意通过使用空间滤波技术来减少噪声,并通过使用频率滤波技术来增加基频估计的鲁棒性。两种技术都采用消除模型的概念。此外,与布雷格曼提出的启发式规则相关的一些约束用于克服与分离两个声源相关的问题。模拟结果表明,空间和频率滤波对于增强语音都很有用。因此,这些过滤方法可以有效地用于自动语音识别系统的前端,并用于语音特征提取。即使在波形中,声音分离模型也可以从噪声信号中精确地提取出所需信号。此外,本研究还讨论了基于哺乳动物听觉生理数据的声源方向估计模型。该模型可以解释神经放电传递的时间和相位信息与耳间时间差的准确性之间的关系。

项目成果

期刊论文数量(32)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Ito, K.and Akagi, M.: "A study on temporal information based on the synchronization index using a computational model"Proc.WESTPRAC7. 263-266 (2000)
Ito, K. 和 Akagi, M.:“使用计算模型对基于同步索引的时间信息进行研究”Proc.WESTPRAC7。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Unoki,M.and Akagi,M.: "A method of signal extraction from noisy signal based on auditory scene analysis"Speech Communication. 27,3-4. 261-279 (1999)
Unoki,M. 和 Akagi,M.:“基于听觉场景分析的噪声信号提取信号的方法”语音通信。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
鵜木,赤木: "聴覚の情景解析に基づいた雑音下の調波復合音の一抽出法"電子情報通信学会論文誌. J82-A,10. 1497-1507 (1999)
Uoki,Akagi:“基于听觉场景分析的噪声下谐波解耦声音的提取方法”,电子、信息和通信工程师学会学报 J82-A,10. 1497-1507 (1999)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Akagi,Mizumachi Ishimoto and Unokl: "Speech enhancement and segregation based on human auditory mechanims"Proc.IS2000,Aizu. 246-253 (2000)
Akagi、Mizumachi Ishimoto 和 Unokl:“基于人类听觉机制的语音增强和分离”Proc.IS2000,会津。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

AKAGI Masato其他文献

AKAGI Masato的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('AKAGI Masato', 18)}}的其他基金

A study on new strategy of emotion recognition in speech
语音情感识别新策略研究
  • 批准号:
    22650032
  • 财政年份:
    2010
  • 资助金额:
    $ 1.98万
  • 项目类别:
    Grant-in-Aid for Challenging Exploratory Research
A study on measurement of brain activities with speech production and perception under transferred auditory feedback conditions
转移听觉反馈条件下言语产生和感知的大脑活动测量研究
  • 批准号:
    20300064
  • 财政年份:
    2008
  • 资助金额:
    $ 1.98万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
A study on interaction between production and perception in speech communication
言语交际中产生与感知交互作用的研究
  • 批准号:
    16300053
  • 财政年份:
    2004
  • 资助金额:
    $ 1.98万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
A study on fluctuation of auditory information based on acoustic information deviations and its perception
基于声信息偏差的听觉信息波动及其感知研究
  • 批准号:
    13610079
  • 财政年份:
    2001
  • 资助金额:
    $ 1.98万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Study on Speaker Individuality in Speech and its Control
言语中说话者个性及其控制研究
  • 批准号:
    07680388
  • 财政年份:
    1995
  • 资助金额:
    $ 1.98万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)

相似海外基金

Collaborative Research: Reverberation Mapping with Multi-Object Spectroscopy - from Sloan Digital Sky Survey Reverberation Mapping to the Black Hole Mapper
合作研究:使用多目标光谱进行混响映射 - 从斯隆数字巡天混响映射到黑洞映射器
  • 批准号:
    2310211
  • 财政年份:
    2023
  • 资助金额:
    $ 1.98万
  • 项目类别:
    Standard Grant
DEVELOPMENT OF FUNCTIONAL SPATIAL HEARING IN REVERBERATION
混响中功能性空间听力的发展
  • 批准号:
    10515265
  • 财政年份:
    2022
  • 资助金额:
    $ 1.98万
  • 项目类别:
DEVELOPMENT OF FUNCTIONAL SPATIAL HEARING IN REVERBERATION
混响中功能性空间听力的发展
  • 批准号:
    10646352
  • 财政年份:
    2022
  • 资助金额:
    $ 1.98万
  • 项目类别:
Multi-Layer Neuronal Imaging with Reverberation Multiphoton Microscopy
使用混响多光子显微镜进行多层神经元成像
  • 批准号:
    10543772
  • 财政年份:
    2020
  • 资助金额:
    $ 1.98万
  • 项目类别:
Collaborative Research: Reverberation Mapping with Multi-Object Spectroscopy - from Sloan Digital Sky Survey Reverberation Mapping to the Black Hole Mapper
合作研究:使用多目标光谱进行混响映射 - 从斯隆数字巡天混响映射到黑洞映射器
  • 批准号:
    2009949
  • 财政年份:
    2020
  • 资助金额:
    $ 1.98万
  • 项目类别:
    Standard Grant
Collaborative Research: Reverberation Mapping with Multi-Object Spectroscopy - from Sloan Digital Sky Survey Reverberation Mapping to the Black Hole Mapper
合作研究:使用多目标光谱进行混响映射 - 从斯隆数字巡天混响映射到黑洞映射器
  • 批准号:
    2009947
  • 财政年份:
    2020
  • 资助金额:
    $ 1.98万
  • 项目类别:
    Standard Grant
Collaborative Research: Reverberation Mapping with Multi-Object Spectroscopy - from Sloan Digital Sky Survey Reverberation Mapping to the Black Hole Mapper
合作研究:使用多目标光谱进行混响映射 - 从斯隆数字巡天混响映射到黑洞映射器
  • 批准号:
    2009539
  • 财政年份:
    2020
  • 资助金额:
    $ 1.98万
  • 项目类别:
    Standard Grant
Multi-layer neuronal imaging with reverberation multiphoton microscopy
使用混响多光子显微镜进行多层神经元成像
  • 批准号:
    10320482
  • 财政年份:
    2020
  • 资助金额:
    $ 1.98万
  • 项目类别:
RUI: Spatially-Resolved Kinematics of Reverberation-Mapped Active Galactic Nuclei Host Galaxies
RUI:混响映射的活动星系核宿主星系的空间分辨运动学
  • 批准号:
    1909297
  • 财政年份:
    2019
  • 资助金额:
    $ 1.98万
  • 项目类别:
    Standard Grant
High-precision sound field auralization platform - late reverberation model and evaluation by performer
高精度声场可听化平台-后期混响模型及表演者评价
  • 批准号:
    19H04153
  • 财政年份:
    2019
  • 资助金额:
    $ 1.98万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了