隠れマルコフモデルを用いた音声の規則合成-喜怒哀楽の表現を目指して-

使用隐马尔可夫模型规则合成语音 - 旨在表达喜、怒、哀、乐 -

基本信息

  • 批准号:
    07858043
  • 负责人:
  • 金额:
    $ 0.58万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
  • 财政年份:
    1995
  • 资助国家:
    日本
  • 起止时间:
    1995 至 无数据
  • 项目状态:
    已结题

项目摘要

(1)隠れマルコフモデルに基づいて音声を合成するために,音声パラメータの動的特徴を利用した隠れマルコフモデルからの音声パラメータ生成法を提案した.(2)そのための高速計算アルゴリズムを導出し,実時間での音声合成を可能とした.(3)音声データベースによって,隠れマルコフモデルの学習を行ない,受聴試験に基づく主観評価によって,動的特徴を考慮することにより,自然で滑らかな音声を合成できることを示した.(4)種々の条件で隠れマルコフモデルの学習を行ない,得られた隠れマルコフモデルから音声を合成し,合成に適した隠れマルコフモデルの構成法について検討した.(5)受聴試験に基づく主観評価によって,隠れマルコフモデルの構造や学習法を検討した.その結果,概ね音声認識と同様の観点から,隠れマルコフモデルの構造や学習法を設定すればよいことがわかった.但し,通常の音声認識と異なり,状態継続長のモデルは音声認識で用いられるものより精密なものにする必要があることもわかった.(6)得られた隠れマルコフモデルに話者適応の技術を適用することにより多様な声質の音声を合成できることを確かめた.(7)今後は以上の結果を元に,自在に感情を表現することのできる音声合成システムを実現することを予定している.
(1)A method for generating sound by using the characteristics of the sound system is proposed. (2)High speed computing, sound synthesis, and time are possible. (3)The sound quality of the sound is very high. The sound quality of the sound is very high. (4)The conditions for the formation of a group of students are as follows: (5)The structure and learning method of the test base are discussed. As a result, the sound recognition and the same point are set. However, in general, the sound recognition is different, and the state of the sound recognition is long. (6)The sound quality of the sound is very high. (7)In the future, the above results will be expressed in a predetermined manner.

项目成果

期刊论文数量(6)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
益子貴史,徳田恵一,小林隆夫,今井聖: "メルケプストラムをパラメータとするHMMに基づく音声合成" 電子情報通信学会技術研究報告. SP95-124. 9-16 (1996)
Takashi Mashiko、Keiichi Tokuda、Takao Kobayashi、Kiyoshi Imai:“基于以梅尔倒谱为参数的 HMM 的语音合成”IEICE 技术报告 SP95-124 (1996)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
K.Tokuda,T.Masuko,T.Yamada,T.Kobayashi and S.Imai: "An algorithm for speech parameter generation from continuous mixture HMMs with dynamic features" Proceedings of European Conference on Speech Communication and Technology. 1. 757-760 (1995)
K.Tokuda、T.Masuko、T.Yamada、T.Kobayashi 和 S.Imai:“一种从具有动态特征的连续混合 HMM 生成语音参数的算法”欧洲语音通信与技术会议论文集。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
T.Masuko,K.Tokuda,T.Kobayashi and S.Imai: "Speech synthesis from HMMs using dynamic features" Proceedings of International Conference on Acoustics, Speech, and Signal Processing. (採録決定). (1996)
T. Masuko、K. Tokuda、T. Kobayashi 和 S. Imai:“使用动态特征的 HMM 进行语音合成”国际声学、语音和信号处理会议论文集(已接受)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
益子貴史,徳田恵一,小林隆夫,今井聖: "HMMを用いた音声合成法に関する検討" 日本音響学会春季研究発表会講演論文集. 2. 253-254 (1995)
Takashi Mashiko、Keiichi Tokuda、Takao Kobayashi、Kiyoshi Imai:“使用 HMM 进行语音合成的研究”日本声学学会春季会议论文集 2. 253-254 (1995)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
益子貴史,徳田恵一,小林隆夫,今井聖: "HMMを用いた音声合成における音素モデルの検討" 日本音響学会春季研究発表会講演論文集. (採録決定). (1996)
Takashi Mashiko、Keiichi Tokuda、Takao Kobayashi、Kiyoshi Imai:“使用 HMM 进行语音合成中的音素模型研究”日本声学学会春季会议论文集(已接受)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

徳田 恵一其他文献

英語音声合成における韻律推定モデルと音響モデルの同時学習
英语语音合成中韵律估计模型和声学模型的同时学习
  • DOI:
  • 发表时间:
    2008
  • 期刊:
  • 影响因子:
    0
  • 作者:
    大浦 圭一郎;戸田 智基;南角 吉彦;徳田 恵一;マイアハニエリ;坂井 信輔;中村 哲
  • 通讯作者:
    中村 哲
分離型2次元格子HMMに基づく顔画像認識
基于可分离二维网格HMM的人脸图像识别
  • DOI:
  • 发表时间:
    2005
  • 期刊:
  • 影响因子:
    0
  • 作者:
    布目 哲也;南角 吉彦;徳田 恵一;北村 正
  • 通讯作者:
    北村 正
Blizzar Challenge 2007のための平均声に基づくHMM音声合成システムの評価
2007 年暴雪挑战赛基于平均语音的 HMM 语音合成系统评估
  • DOI:
  • 发表时间:
    2008
  • 期刊:
  • 影响因子:
    0
  • 作者:
    能勢 隆;山岸 順一;全 柄河;戸田 智基;徳田 恵一
  • 通讯作者:
    徳田 恵一
Knowledge-based Discovery in Systems Biology using CF-Induction.
使用 CF-Induction 在系统生物学中进行基于知识的发现。
F0量子化と非パラレル学習に基づく声質変換の評価
基于F0量化和非并行学习的语音质量转换评估

徳田 恵一的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('徳田 恵一', 18)}}的其他基金

深層学習に基づいた新世代音声・オーディオ信号生成に関する研究
基于深度学习的新一代语音音频信号生成研究
  • 批准号:
    23K24870
  • 财政年份:
    2024
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Next-generation audio and speech processing architectures based on deep learning
基于深度学习的下一代音频和语音处理架构
  • 批准号:
    22H03614
  • 财政年份:
    2022
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
t分布仮定に基づくロバストスペクトル推定
基于t分布假设的鲁棒谱估计
  • 批准号:
    97F00343
  • 财政年份:
    1998
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
マルチモーダル音声認識・合成によるインターフェースの構築
使用多模态语音识别和合成构建界面
  • 批准号:
    10780226
  • 财政年份:
    1998
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
隠れマルコフモデルを用いた認識ボコーダー極低ビットレート音声符号化-
使用隐马尔可夫模型进行极低比特率语音编码的识别声码器
  • 批准号:
    08780333
  • 财政年份:
    1996
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
音声データ圧縮・蓄積システムの高品質・低ビットレート化に関する研究
高质量低码率音频数据压缩与存储系统研究
  • 批准号:
    06750373
  • 财政年份:
    1994
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
適応メルケプストラム分析法に基づく音声の高能率符号化法に関する研究
基于自适应梅尔倒谱分析方法的高效语音编码方法研究
  • 批准号:
    04750270
  • 财政年份:
    1992
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)

相似海外基金

インターネットデータの活用によるテキスト音声合成の感情表現力向上
利用互联网数据提高文本语音合成的情感表现力
  • 批准号:
    24KJ0860
  • 财政年份:
    2024
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
脳神経疾患による構音障害を克服するための,音声認識および音声合成AIシステムの開発
开发语音识别与语音合成AI系统,克服脑神经疾病引起的构音障碍
  • 批准号:
    24K10630
  • 财政年份:
    2024
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
話者・地域・スタイルモーフィング音声合成による実環境リスニング学習支援
使用说话者/区域/风格变形语音合成来支持真实世界的听力学习
  • 批准号:
    23K21945
  • 财政年份:
    2024
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
顔画像から声を再現するクロスモーダルボイスクローニング音声合成技術の研究
从面部图像再现声音的跨模态克隆语音合成技术研究
  • 批准号:
    24K02959
  • 财政年份:
    2024
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
非侵襲型脳波を用いた言語・非言語音声合成による次世代コミュニケーション技術の確立
通过使用非侵入性脑电波进行言语/非言语语音合成来建立下一代通信技术
  • 批准号:
    24H00715
  • 财政年份:
    2024
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)
音声認識のデータ拡張のための音声合成との密統合
与语音合成紧密集成,用于语音识别的数据增强
  • 批准号:
    23K16944
  • 财政年份:
    2023
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
話者・地域・スタイルモーフィング音声合成による実環境リスニング学習支援
使用说话者/区域/风格变形语音合成来支持真实世界的听力学习
  • 批准号:
    22H00673
  • 财政年份:
    2022
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
eスポーツ理解に向けた実況解説音声の分析及び音声合成アルゴリズムの開発
分析现场解说音频并开发理解电子竞技的语音合成算法
  • 批准号:
    22K17945
  • 财政年份:
    2022
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
複数の調音運動データを中間情報とするマルチモーダル音声合成
使用多个发音运动数据作为中间信息的多模态语音合成
  • 批准号:
    22K12100
  • 财政年份:
    2022
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
感情や個人性を高品質に表現可能なDNNに基づく音声合成方式の研究
基于DNN的高质量表达情感和个性的语音合成方法研究
  • 批准号:
    21K11963
  • 财政年份:
    2021
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了