雑音・残響環境下における基本周波数推定法に関する研究
噪声/混响环境下基频估计方法研究
基本信息
- 批准号:14780267
- 负责人:
- 金额:$ 1.98万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Young Scientists (B)
- 财政年份:2002
- 资助国家:日本
- 起止时间:2002 至 2004
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
本研究では,計算論的な聴覚情景分析の考えに基づいて,実環境下における基本周波数の推定法を確立するために,次の課題に取り組んでいる.(1)聴覚心理学・生理学の知見を踏まえ,音の聴覚的情報表現を考慮した上で,その中から基本周波数を推定する数理的メカニズムを検討する.(2)基本周波数を推定するために必要な特徴量が,どれだけ雑音・残響に影響を受けるかを検討し,ロバストであるための方略を明らかにする.(3)クリーンな時だけでなく,雑音・残響に頑健で精度の高い基本周波数推定法を確立する.これまでに,雑音環境に特化して(1)-(2)に取り組み,雑音に頑健な信号の瞬時振幅における周期性と調波性を利用した基本周波数推定法を実装した.本年度は,残響環境に特化して(1)-(2)に取り組んだ.(1)については先の検討と同じものとした.(2)については,昨年度に引き続き,残響環境に頑健な音声信号の特徴を洗い出すために,これまでに利用されてきた様々な基本周波数推定方法を比較検討した.この結果,最小位相特性を有する信号成分から推定された音源情報における周期性・調波性が残響に関して頑健であることがわかり,この特徴を利用した基本周波数推定法を実装した.室内音響特性を統計的に模擬したインパルス応答を利用して大規模なシミュレーションにて本手法の評価を行ったところ,残響に関して頑健であることが示された.現段階では,雑音に頑健な推定法と残響に頑健な推定法の方略がそれぞれに特化しているため,課題(3)として両者を同時に達成できる手法にはまだ至っていない.しかしながら,雑音や残響それぞれに対する基本周波数推定法を提案することができたため,例えば,残響時間が短い環境での耐雑音特性を必要とするような環境では,本手法を効果的に適用できるものと考えられる.
This study is aimed at the investigation of computational theory and scenario analysis, and the establishment of estimation method of basic cycle number under real environment. (1)The knowledge of psychology and physiology, the information representation of sound and sound, the estimation of basic cycle number, and the discussion of mathematics. (2)Basic cycle number is estimated to be the necessary characteristic quantity, and the influence of residual sound is discussed. (3)The basic frequency estimation method is established with high accuracy. In this case, the noise environment is characterized by (1)-(2), and the combination, the instantaneous amplitude, the periodicity and the modulation of the noise signal are used to estimate the basic cycle number. This year, the residual environment is special <$<$(1)-(2) choose. (1)The first one is the same as the first one. (2)In this paper, we compare and discuss the estimation methods of basic frequency by using the characteristics of acoustic signals in the residual environment. As a result, the minimum phase characteristic is used to estimate the signal component, the periodicity, the modulation, the residual noise, and the basic frequency estimation method. Indoor acoustic characteristics of statistical analysis of the use of large-scale evaluation of the method of sound, residual sound related to the health of the show. At the present stage, the method of estimation of sound and residual sound and the strategy of estimation of sound and residual sound are specialized, and the problem (3) is achieved simultaneously. The basic frequency estimation method is proposed to estimate the frequency of sound and residual sound in the environment.
项目成果
期刊论文数量(7)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
窪 正晃, 鵜木 祐史, 赤木正人: "楽器音の音響的特徴を知識として用いた目的音の選択的分離抽出法"日本音響学会聴覚研究会資料. 32(10). 585-590 (2002)
Masaaki Kubo、Yuji Uki、Masato Akagi:“利用乐器声音的声学特征作为知识的目标声音的选择性分离和提取方法”日本声学学会听觉研究小组的材料 32(10)(585-590)。 2002)
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
Fundamental frequency estimation for noisy speech based on instantaneous amplitude and frequency
基于瞬时幅度和频率的噪声语音基频估计
- DOI:
- 发表时间:2005
- 期刊:
- 影响因子:0
- 作者:Ishimoto;Y.;Unoki;M.;Akagi;M.
- 通讯作者:M.
A speech dereverberation method based on the MTF concept using adaptive time-frequency divisions
一种基于MTF概念的自适应时频划分的语音去混响方法
- DOI:
- 发表时间:2004
- 期刊:
- 影响因子:0
- 作者:Unoki;M.;Toi;M.;Akagi;M.
- 通讯作者:M.
古川 正和, 鵜木 祐史, 赤木 正人: "MTFに基づいた残響音声パワーエンベロープの回復方法"電子情報通信学会技術報告. 102(33). 49-54 (2002)
Masakazu Furukawa、Yuji Uki、Masato Akagi:“基于 MTF 的混响音频功率包络恢复方法”IEICE 技术报告 102(33)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
Masashi Unoki, Keigo Sakata, Masato Akagi: "A speech dereverberation method based on the MTF concept"Proc.EuroSpeech2003. 1417-1420 (2003)
Masashi Unoki、Keigo Sakata、Masato Akagi:“基于 MTF 概念的语音去混响方法”Proc.EuroSpeech2003。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
鵜木 祐史其他文献
Internal logic viewed from observation space: Theory and a case study
从观察空间看内部逻辑:理论与案例研究
- DOI:
- 发表时间:
2007 - 期刊:
- 影响因子:0
- 作者:
羽二 生篤;鵜木 祐史;赤木 正人;M. Hatakeyama - 通讯作者:
M. Hatakeyama
Controlling engine data : Nonperiodic fluctuations in a spark ignition engine of motorcycle and its stabilization
控制发动机数据:摩托车火花点火发动机的非周期性波动及其稳定性
- DOI:
- 发表时间:
2006 - 期刊:
- 影响因子:0
- 作者:
羽二 生篤;鵜木 祐史;赤木 正人;M. Hatakeyama;Kazuhiro Matsumoto;I. Tsuda;Y. Fukushima;伊藤孝男;Y.Yamaguti;K.Matsumoto - 通讯作者:
K.Matsumoto
脳の中のカオス
大脑混乱
- DOI:
- 发表时间:
2006 - 期刊:
- 影响因子:0
- 作者:
羽二 生篤;鵜木 祐史;赤木 正人;M. Hatakeyama;Kazuhiro Matsumoto;I. Tsuda;Y. Fukushima;伊藤孝男;Y.Yamaguti;K.Matsumoto;S.Tadokoro;津田一郎 - 通讯作者:
津田一郎
鵜木 祐史的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('鵜木 祐史', 18)}}的其他基金
振幅変調知覚に基づく聴覚エンリッチメント:人工内耳用音声信号処理の研究
基于调幅感知的听觉丰富:人工耳蜗音频信号处理研究
- 批准号:
23K21679 - 财政年份:2024
- 资助金额:
$ 1.98万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
Voice information-hiding/anonymization technology for voice privacy protection
语音信息隐藏/匿名化技术,保护语音隐私
- 批准号:
23K18491 - 财政年份:2023
- 资助金额:
$ 1.98万 - 项目类别:
Grant-in-Aid for Challenging Research (Exploratory)
Auditory Enrichment based on perception of amplitude modulation: Study on speech signal processing for Cochlear Implant
基于幅度调制感知的听觉丰富:人工耳蜗语音信号处理研究
- 批准号:
21H03463 - 财政年份:2021
- 资助金额:
$ 1.98万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
VOICE 2.0: towards augmentation of enriched speech communication
VOICE 2.0:增强丰富的语音通信
- 批准号:
20KK0233 - 财政年份:2020
- 资助金额:
$ 1.98万 - 项目类别:
Fund for the Promotion of Joint International Research (Fostering Joint International Research (B))
蝸牛遅延特性を利用した音信号への情報ハイディング
利用耳蜗延迟特性将信息隐藏到声音信号中
- 批准号:
21650035 - 财政年份:2009
- 资助金额:
$ 1.98万 - 项目类别:
Grant-in-Aid for Challenging Exploratory Research
変調伝達関数に基づいた骨導音声の明瞭度回復法の基礎検討
基于调制传递函数的骨导语音清晰度恢复方法基础研究
- 批准号:
17650048 - 财政年份:2005
- 资助金额:
$ 1.98万 - 项目类别:
Grant-in-Aid for Exploratory Research
音の分離・抽出における聴覚の計算理論に関する基礎的研究
声音分离提取中的听觉计算理论基础研究
- 批准号:
98J08110 - 财政年份:1998
- 资助金额:
$ 1.98万 - 项目类别:
Grant-in-Aid for JSPS Fellows
相似海外基金
計算論的聴覚情景解析に基づくブラインド音源分離に関する研究
基于计算听觉场景分析的盲声源分离研究
- 批准号:
09J07607 - 财政年份:2009
- 资助金额:
$ 1.98万 - 项目类别:
Grant-in-Aid for JSPS Fellows