時変複素AR(TV-CAR)音声分析法の高度化と音声符号化・音声認識処理への適用
时变复杂AR(TV-CAR)语音分析方法及其在语音编码和语音识别处理中的应用进展
基本信息
- 批准号:12750344
- 负责人:
- 金额:$ 1.41万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Encouragement of Young Scientists (A)
- 财政年份:2000
- 资助国家:日本
- 起止时间:2000 至 2001
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
音声の生成過程を時変複素ARモデルとし、解析信号をターゲットとする、時変複素AR分析の提案を行っている。従来のARモデルを時変複素化するために、AR係数を任意の複素基底関数による展開で記述し、展開の係数を音声分析法で推定する。既に、MMSE、M推定、補助変数(IV)法による分析アルゴリズムを提案した。今年度は、一般化最小2乗法(GLS>と拡大最小2乗法(ELS)に基づくロバストな時変複素AR音声分析法の構築を行い、さらに、前向き後向き予測によるGLS分析の構築も行った。GLS、ELSではMMSE式誤差をARモデルで記述し、式誤差にその逆フィルタ(白色化フィルタ)を掛けることで白色化を行う。式誤差は観測量ではないので時変複素ARフィルタと白色化フィルタの双方の係数を同時推定することはできないので、繰り返し推定によりアルゴリズムを実現する。なお、ELSはGLSの等価解である。白色雑音、ピンク雑音、工場雑音を付加した実音声を用いてスペクトル推定を行った結果、MMSEに比べて、GLSとELSは雑音の影響を受けない、平坦さの少ないスペクトルが推定できることを確認した。しかし、フレーム内での時変性が失われてしまい、フレーム間での推定スペクトルにギャップが生じるという問題が残った。そこで、GLSに前向き後向き予測に基づく分析アルゴリズムを提案した。前向き予測とは過去の信号を用いて現在の信号を予測する手法であり、後向き予測とは未来の信号を用いて現在の信号を予測する手法である。したがって、前向き後向き予測方式とは、前向き予測によるMSE(Mean of Squared Error)と後向き予測によるMSE(Mean of Squared Error)の和を最小化するようにパラメータを推定する方式である。MMSE法とGLSについて前向き後向き予測によるアルゴリズムを示し、雑音付加実音声を用いて実験を行った結果、前向き後向き予測GLSは前向き予測しか用いないGLSより滑らかなスペクトルを推定することが確認できた。
The sound generation process is time-dependent AR analysis. The signal is time-dependent AR analysis. AR coefficients are estimated by the method of acoustic analysis. Both MMSE, M estimation and subsidy (IV) methods are proposed for analysis. This year, the generalized minimum 2-D method (GLS) and the maximum minimum 2-D method (ELS) are used to construct the basic time-varying AR acoustic analysis method. GLS, ELS, MMSE error, AR, description, error, inverse, white, white The error of the equation is calculated by calculating the coefficients of the two components simultaneously. , ELS White noise, white noise The problem of time and space is not solved. GLS forward to backward to forward to forward to backward to backward to forward to backward to forward to backward to backward to forward to backward to forward to backward to backward to forward to backward to backward to forward to forward to backward to backward to forward to backward to backward to forward to forward to backward to Forward prediction, backward prediction, current prediction MSE (Mean of Squared Error) and MSE (Mean of Squared Error) of backward prediction MMSE method and GLS method are used to predict the forward direction and backward direction, and to estimate the forward direction and backward direction.
项目成果
期刊论文数量(11)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Keiichi Funaki: "A time-varying complex speech analysis based on IV"Proc.of ICSLP-2000. IV. 688-691 (2000)
Keiichi Funaki:“基于 IV 的时变复杂语音分析”Proc.of ICSLP-2000。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
舟木慶一, 長浜貴乃: "前向き後向き予測による時変複素音声分析"日本音響学会2002年春季研究発表会講演論文集. I. 359-360 (2002)
Keiichi Funaki、Takano Nagahama:“使用前向-后向预测的时变复杂语音分析”日本声学学会 2002 年春季会议记录 I. 359-360 (2002)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
舟木慶一, 長浜貴乃: "ELSに基づく時変複素音声分析"第16回DSPシンポジウム講演論文集. (2002)
Keiichi Funaki、Takano Nagahama:“基于 ELS 的时变复杂语音分析”第 16 届 DSP 研讨会论文集(2002 年)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
Keiichi Funaki: "A time-varying complex AR speech analysis based on GLS and ELS"Proc.of Eurospeech 2001. (2001)
Keiichi Funaki:“基于 GLS 和 ELS 的时变复杂 AR 语音分析”Proc.of Eurospeech 2001。 (2001)
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
舟木慶一: "補助変数(IV)法を用いた時変複素AR分析"日本音響学会2000年秋季研究発表会講演論文集. I. 269-270 (2000)
Keiichi Funaki:“使用辅助变量 (IV) 方法进行时变复杂 AR 分析”日本声学学会 2000 年秋季研究会议论文集 I. 269-270 (2000)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
舟木 慶一其他文献
舟木 慶一的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
相似海外基金
Moreau型非凸正則化モデルの最適化アルゴリズム構築と超複素信号処理への応用
Moreau型非凸正则化模型优化算法的构建及其在超复杂信号处理中的应用
- 批准号:
23KJ0945 - 财政年份:2023
- 资助金额:
$ 1.41万 - 项目类别:
Grant-in-Aid for JSPS Fellows
Low Voltage Operation Analog Signal Processing Circuits for Complex Signal Processing
用于复杂信号处理的低电压工作模拟信号处理电路
- 批准号:
22560356 - 财政年份:2010
- 资助金额:
$ 1.41万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Complex signal processing circuits and systems
复杂的信号处理电路和系统
- 批准号:
121662-2005 - 财政年份:2009
- 资助金额:
$ 1.41万 - 项目类别:
Discovery Grants Program - Individual
Complex signal processing circuits and systems
复杂的信号处理电路和系统
- 批准号:
121662-2005 - 财政年份:2008
- 资助金额:
$ 1.41万 - 项目类别:
Discovery Grants Program - Individual
Complex signal processing circuits and systems
复杂的信号处理电路和系统
- 批准号:
121662-2005 - 财政年份:2007
- 资助金额:
$ 1.41万 - 项目类别:
Discovery Grants Program - Individual
Complex signal processing circuits and systems
复杂的信号处理电路和系统
- 批准号:
121662-2005 - 财政年份:2006
- 资助金额:
$ 1.41万 - 项目类别:
Discovery Grants Program - Individual
Complex signal processing circuits and systems
复杂的信号处理电路和系统
- 批准号:
121662-2005 - 财政年份:2005
- 资助金额:
$ 1.41万 - 项目类别:
Discovery Grants Program - Individual
Complex signal processing circuits and systems
复杂的信号处理电路和系统
- 批准号:
121662-2004 - 财政年份:2004
- 资助金额:
$ 1.41万 - 项目类别:
Discovery Grants Program - Individual
SPEECH AND COMPLEX SIGNAL PROCESSING IN THE COCHLEAR NUCLEUS
耳蜗核中的语音和复杂信号处理
- 批准号:
6564025 - 财政年份:2002
- 资助金额:
$ 1.41万 - 项目类别:
SPEECH AND COMPLEX SIGNAL PROCESSING IN THE COCHLEAR NUCLEUS
耳蜗核中的语音和复杂信号处理
- 批准号:
6424533 - 财政年份:2001
- 资助金额:
$ 1.41万 - 项目类别: