隠れマルコフモデルを用いた認識ボコーダー極低ビットレート音声符号化-

使用隐马尔可夫模型进行极低比特率语音编码的识别声码器

基本信息

  • 批准号:
    08780333
  • 负责人:
  • 金额:
    $ 0.64万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
  • 财政年份:
    1996
  • 资助国家:
    日本
  • 起止时间:
    1996 至 无数据
  • 项目状态:
    已结题

项目摘要

(1)音声合成及び音声認識に適した隠れマルコフモデルの単位や構造について検討を行った.その結果,概して音声認識率の良いモデルが,合成音声の品質もよいことがわかった.但し,継続長は,モデルがもつ継続長ではなく,認識時に得られた継続長を用いて音声合成を行う必要があることもわかった.(2)受聴試験に基づく主観評価実験により,提案符号化システムの音声品質評価を行なった.その結果,通常用いられるベクトル量子化法に比べて,約半分のビットレート(約200bit/s)で音声スペクトル情報を符号化したにも関わらず,大きく音声品質を改善できることがわかった(MOS値で約0.3の改善).(3)異なる話者に対応するため,音声認識における話者適応の手法を導入することを検討した.その結果,男性話者間の適応は,良好に行うことができるが,男性話者から女性話者、あるいはその逆の適応は,若干精度が悪くなることもわかった.(4)上記問題に対応するため,代表話者何人かの隠れマルコフモデルを用意し、それらを補間する方法について検討を行い,男性話者と女性話者の間の補間も良好に行われることを確認した.
(1) voice synthesis and び sounds know に optimum し た government れ マ ル コ フ モ デ ル の 単 や structures に つ い て 検 line for を っ た. そ の as a result, almost し て sounds good understanding rate の い モ デ ル が, synthetic sounds の quality も よ い こ と が わ か っ た. But し 継 続 は long, モ デ ル が も つ 継 続 long で は な く, meet when に ら れ た 継 続 を with い て voice synthesis を line う necessary が あ る こ と も わ か っ た. (2) the 聴 test に base づ く main 観 review 価 be 験 に よ り, proposal symbolic シ ス テ ム の voice quality assessment 価 を line な っ た. そ の results, usually use い ら れ る ベ ク ト ル quantization method に than べ て, about half a cent の ビ ッ ト レ ー ト (about 200 - bit/s) で sounds ス ペ ク ト ル intelligence を symbolic し た に も masato わ ら ず, big き く を sounds quality improve で き る こ と が わ か っ た (MOS numerical で about 0.3 の improve). (3) different な る words に 応 seaborne す る た め, sounds know に お け る words optimum 応 の gimmick を import す る Beg し こ と を 検 た. そ の as a result, the male words between の optimum 応 は, good line に う こ と が で き る が, male words か ら female words, あ る い は そ の inverse の optimum 応 は, several precision が 悪 く な る こ と も わ か っ た. (4) written questions に 応 seaborne す る た め, on behalf of whom the speaker's words か の government れ マ ル コ フ モ デ ル を intention し, そ れ ら を す between る method に つ い て 検 for line を い, male words words と females の の fill も に good line between わ れ る こ と を confirm し た.

项目成果

期刊论文数量(6)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
徳田恵一: "動的特徴を用いたHMMからの音声パラメータ生成アルゴリズム" 日本音響学会誌. 53,3(採録決定済). (1997)
Keiichi Tokuda:“使用动态特征的 HMM 音频参数生成算法”,日本声学学会杂志 53,3(已接受)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Takashi Masuko: "Speech synthesis from HMMs using dynamic features" Proceedings of International Conference on Acoustics,Speech,and Signal Processing. 1. 389-392 (1996)
Takashi Masuko:“使用动态特征从 HMM 进行语音合成”国际声学、语音和信号处理会议论文集。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Takashi Masuko: "HMM-based speech synthesis with various voice characteristics" Proceedings of Joint ASA/ASJ Meeting. 1043-1046 (1996)
Takashi Masuko:“具有各种语音特征的基于 HMM 的语音合成”ASA/ASJ 联合会议记录。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
益子貴史: "動的特徴を用いたHMMに基づく音声合成" 電子情報通信学会論文誌. J79-D-II,12. 2184-2190 (1997)
Takashi Mashiko:“基于使用动态特征的 HMM 的语音合成”,电子、信息和通信工程师学会汇刊 J79-D-II,12(1997 年)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Takashi Masuko: "Voice characteristics conversion for HMM-based speech synthesis system" Proceedings of International Conference on Acoustics,Speech,and Signal Processing. (採録決定済). (1997)
Takashi Masuko:“基于 HMM 的语音合成系统的语音特征转换”国际声学、语音和信号处理会议论文集(已接受)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

徳田 恵一其他文献

英語音声合成における韻律推定モデルと音響モデルの同時学習
英语语音合成中韵律估计模型和声学模型的同时学习
  • DOI:
  • 发表时间:
    2008
  • 期刊:
  • 影响因子:
    0
  • 作者:
    大浦 圭一郎;戸田 智基;南角 吉彦;徳田 恵一;マイアハニエリ;坂井 信輔;中村 哲
  • 通讯作者:
    中村 哲
分離型2次元格子HMMに基づく顔画像認識
基于可分离二维网格HMM的人脸图像识别
  • DOI:
  • 发表时间:
    2005
  • 期刊:
  • 影响因子:
    0
  • 作者:
    布目 哲也;南角 吉彦;徳田 恵一;北村 正
  • 通讯作者:
    北村 正
Blizzar Challenge 2007のための平均声に基づくHMM音声合成システムの評価
2007 年暴雪挑战赛基于平均语音的 HMM 语音合成系统评估
  • DOI:
  • 发表时间:
    2008
  • 期刊:
  • 影响因子:
    0
  • 作者:
    能勢 隆;山岸 順一;全 柄河;戸田 智基;徳田 恵一
  • 通讯作者:
    徳田 恵一
Knowledge-based Discovery in Systems Biology using CF-Induction.
使用 CF-Induction 在系统生物学中进行基于知识的发现。
F0量子化と非パラレル学習に基づく声質変換の評価
基于F0量化和非并行学习的语音质量转换评估

徳田 恵一的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('徳田 恵一', 18)}}的其他基金

深層学習に基づいた新世代音声・オーディオ信号生成に関する研究
基于深度学习的新一代语音音频信号生成研究
  • 批准号:
    23K24870
  • 财政年份:
    2024
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Next-generation audio and speech processing architectures based on deep learning
基于深度学习的下一代音频和语音处理架构
  • 批准号:
    22H03614
  • 财政年份:
    2022
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
t分布仮定に基づくロバストスペクトル推定
基于t分布假设的鲁棒谱估计
  • 批准号:
    97F00343
  • 财政年份:
    1998
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
マルチモーダル音声認識・合成によるインターフェースの構築
使用多模态语音识别和合成构建界面
  • 批准号:
    10780226
  • 财政年份:
    1998
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
隠れマルコフモデルを用いた音声の規則合成-喜怒哀楽の表現を目指して-
使用隐马尔可夫模型规则合成语音 - 旨在表达喜、怒、哀、乐 -
  • 批准号:
    07858043
  • 财政年份:
    1995
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
音声データ圧縮・蓄積システムの高品質・低ビットレート化に関する研究
高质量低码率音频数据压缩与存储系统研究
  • 批准号:
    06750373
  • 财政年份:
    1994
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
適応メルケプストラム分析法に基づく音声の高能率符号化法に関する研究
基于自适应梅尔倒谱分析方法的高效语音编码方法研究
  • 批准号:
    04750270
  • 财政年份:
    1992
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)

相似海外基金

隠れマルコフモデルに基づいた睡眠時ブラキシズム検査における筋電図波形識別の試み
尝试基于隐马尔可夫模型识别睡眠磨牙症测试中的肌电图波形
  • 批准号:
    20K23107
  • 财政年份:
    2020
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Research Activity Start-up
隠れマルコフモデルを用いた自己組織化写像の拡張及びプロモータ配列の推定
使用隐马尔可夫模型扩展自组织映射和启动子序列估计
  • 批准号:
    05J02795
  • 财政年份:
    2005
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
隠れマルコフモデルを用いたウエーブレットによる統計的信号処理とそのインターネット
使用隐马尔可夫模型及其互联网的小波统计信号处理
  • 批准号:
    99F00430
  • 财政年份:
    2001
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
音声認識のための動的特徴を効果的に用いる隠れマルコフモデルに関する研究
有效利用动态特征进行语音识别的隐马尔可夫模型研究
  • 批准号:
    13780274
  • 财政年份:
    2001
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
隠れマルコフモデルを用いた音声合成-人間のように話す機械の実現に向けて-
使用隐马尔可夫模型的语音合成 - 实现像人类一样说话的机器 -
  • 批准号:
    08750506
  • 财政年份:
    1996
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
隠れマルコフモデルを用いた音声の規則合成-喜怒哀楽の表現を目指して-
使用隐马尔可夫模型规则合成语音 - 旨在表达喜、怒、哀、乐 -
  • 批准号:
    07858043
  • 财政年份:
    1995
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了