权益分类	功能权益	普通用户	{{item.name}}会员
{{category.name}}	{{benefitItem.name}}

隠れマルコフモデルを用いた認識ボコーダー極低ビットレート音声符号化-

使用隐马尔可夫模型进行极低比特率语音编码的识别声码器

基本信息

批准号：
08780333
负责人：
徳田恵一
金额：
$ 0.64万
依托单位：
Nagoya Institute of Technology
依托单位国家：
日本
项目类别：
Grant-in-Aid for Encouragement of Young Scientists (A)
财政年份：
1996
资助国家：
日本
起止时间：
1996 至无数据
项目状态：
已结题

项目摘要

(1)音声合成及び音声認識に適した隠れマルコフモデルの単位や構造について検討を行った.その結果,概して音声認識率の良いモデルが,合成音声の品質もよいことがわかった.但し,継続長は,モデルがもつ継続長ではなく,認識時に得られた継続長を用いて音声合成を行う必要があることもわかった.(2)受聴試験に基づく主観評価実験により,提案符号化システムの音声品質評価を行なった.その結果,通常用いられるベクトル量子化法に比べて,約半分のビットレート(約200bit/s)で音声スペクトル情報を符号化したにも関わらず,大きく音声品質を改善できることがわかった(MOS値で約0.3の改善).(3)異なる話者に対応するため,音声認識における話者適応の手法を導入することを検討した.その結果,男性話者間の適応は,良好に行うことができるが,男性話者から女性話者、あるいはその逆の適応は,若干精度が悪くなることもわかった.(4)上記問題に対応するため,代表話者何人かの隠れマルコフモデルを用意し、それらを補間する方法について検討を行い,男性話者と女性話者の間の補間も良好に行われることを確認した.

(1) Sound synthesis and sound synthesis. The results show that the sound quality is very high, and the synthetic sound quality is very good. However, if you need to use the sound synthesis method to synthesize the sound, you will need to use the sound synthesis method to do the necessary work. (2) if you are the recipient, you should symbolize the sound quality of the receiver, and propose symbolizing it. The results are usually compared by the quantization method, which is about 200bit/s. The sound is symbolized, and the sound quality is improved. (the MOS is about 0.3%). (3) people who don't know how to do it. The sound and sound of people who don't know what's going on in the sound and the way they use it. The results show that there is a good relationship between men and women, and that in men, women, girls, girls Both men and women have a good relationship between men and women.

项目成果

期刊论文数量（6）

专著数量（0）

科研奖励数量（0）

会议论文数量（0）

专利数量（0）

徳田恵一: "動的特徴を用いたHMMからの音声パラメータ生成アルゴリズム" 日本音響学会誌. 53,3(採録決定済). (1997)

Keiichi Tokuda：“使用动态特征的 HMM 音频参数生成算法”，日本声学学会杂志 53,3（已接受）。

DOI：
发表时间：
期刊：
影响因子：
0
作者：
通讯作者：

Takashi Masuko: "Speech synthesis from HMMs using dynamic features" Proceedings of International Conference on Acoustics,Speech,and Signal Processing. 1. 389-392 (1996)

Takashi Masuko：“使用动态特征从 HMM 进行语音合成”国际声学、语音和信号处理会议论文集。

DOI：
发表时间：
期刊：
影响因子：
0
作者：
通讯作者：

Takashi Masuko: "HMM-based speech synthesis with various voice characteristics" Proceedings of Joint ASA/ASJ Meeting. 1043-1046 (1996)

Takashi Masuko：“具有各种语音特征的基于 HMM 的语音合成”ASA/ASJ 联合会议记录。

DOI：
发表时间：
期刊：
影响因子：
0
作者：
通讯作者：

益子貴史: "動的特徴を用いたHMMに基づく音声合成" 電子情報通信学会論文誌. J79-D-II,12. 2184-2190 (1997)

Takashi Mashiko：“基于使用动态特征的 HMM 的语音合成”，电子、信息和通信工程师学会汇刊 J79-D-II，12（1997 年）。

DOI：
发表时间：
期刊：
影响因子：
0
作者：
通讯作者：

Takashi Masuko: "Voice characteristics conversion for HMM-based speech synthesis system" Proceedings of International Conference on Acoustics,Speech,and Signal Processing. (採録決定済). (1997)

Takashi Masuko：“基于 HMM 的语音合成系统的语音特征转换”国际声学、语音和信号处理会议论文集（已接受）。

DOI：
发表时间：
期刊：
影响因子：
0
作者：
通讯作者：

DOI：
{{ item.doi }}
发表时间：
{{ item.publish_year }}
期刊：
{{ item.journal_name }}
影响因子：
{{ item.factor }}
作者：
{{ item.authors }}
通讯作者：
{{ item.author }}

数据更新时间：{{ journalArticles.updateTime }}

作者：
{{ item.author }}

数据更新时间：{{ monograph.updateTime }}

作者：
{{ item.author }}

数据更新时间：{{ sciAawards.updateTime }}

作者：
{{ item.author }}

数据更新时间：{{ conferencePapers.updateTime }}

作者：
{{ item.author }}

数据更新时间：{{ patent.updateTime }}

徳田恵一其他文献

英語音声合成における韻律推定モデルと音響モデルの同時学習

英语语音合成中韵律估计模型和声学模型的同时学习

DOI：
发表时间：
2008
期刊：
影响因子：
0
作者：
大浦圭一郎;戸田智基;南角吉彦;徳田恵一;マイアハニエリ;坂井信輔;中村哲
通讯作者：
中村哲

分離型2次元格子HMMに基づく顔画像認識

基于可分离二维网格HMM的人脸图像识别

DOI：
发表时间：
2005
期刊：
2005年FIT講演論文集
影响因子：
0
作者：
布目哲也;南角吉彦;徳田恵一;北村正
通讯作者：
北村正

Blizzar Challenge 2007のための平均声に基づくHMM音声合成システムの評価

2007 年暴雪挑战赛基于平均语音的 HMM 语音合成系统评估

DOI：
发表时间：
2008
期刊：
影响因子：
0
作者：
能勢隆;山岸順一;全柄河;戸田智基;徳田恵一
通讯作者：
徳田恵一

Knowledge-based Discovery in Systems Biology using CF-Induction.

使用 CF-Induction 在系统生物学中进行基于知识的发现。

DOI：
发表时间：
2007
期刊：
New Trends in Applied Artificial Intelligence, Lecture Notes in Artificial Intelligence 4570
影响因子：
0
作者：
全柄河;南角吉彦;徳田恵一;Andrei Doncescu
通讯作者：
Andrei Doncescu