A study on speech diversification techniques based on corpus design for advanced humanoid speech synthesis

基于语料库设计的高级类人语音合成语音多样化技术研究

基本信息

项目摘要

Our goal in this research is to realize more human-like, natural text-to-speech system with various emotional expressions and speaking styles, and the achievements of our studies are as follows:(1)We proposed a novel corpus-design technique in which accent, style, and sentence-final expression are taken into account. (2)We incorporated user's subjective emotional intensities into acoustic model training to improve the performance of expressive speech synthesis. (3)We proposed an automatic labeling technique of emphasis expression using a parameter generation technique of fundamental frequency to realize emphatic speech synthesis. (4)We proposed cross-lingual speech synthesis using only a target speaker's native language speech samples to synthesis multi-lingual speech at a low cost.
我们的研究目标是实现具有多种情感表达和说话风格的更接近人类、更自然的文本到语音系统,我们的研究成果如下:(1)我们提出了一种新的语料库设计技术,该技术考虑了口音、风格和句子最终表达。(2)将用户主观情绪强度纳入声学模型训练,提高表达性语音合成性能。(3)提出了一种基于基频参数生成技术的强调表达自动标注技术,实现了强调语音合成。(4)提出了仅使用目标说话人的母语语音样本进行跨语言语音合成,以低成本合成多语言语音。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
共有決定木を利用した話者適応に基づくクロスリンガル音声合成の検討
基于共享决策树的说话人适应的跨语言语音合成研究
HMM音声合成における不特定話者スタイル変換の検討
HMM语音合成中与说话人无关的风格转换研究
A tone-modeling technique using a quantized F0 context to improvetone correctness in average-voice-based speech synthesis
一种音调建模技术,使用量化的 F0 上下文来提高基于平均语音的语音合成中的音调正确性
  • DOI:
  • 发表时间:
    2012
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Vataya Chunwijitra;Takashi Nose;TakaoKobayashi
  • 通讯作者:
    TakaoKobayashi
Speaker-independent HMM-based voice conversion using adaptive quantization of the fundamental frequency
  • DOI:
    10.1016/j.specom.2011.05.001
  • 发表时间:
    2011-09
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Takashi Nose;Takao Kobayashi
  • 通讯作者:
    Takashi Nose;Takao Kobayashi
パラ言語情報を表現可能な対話音声合成のための重回帰HSMMの検討
表达副语言信息的对话语音合成多元回归HSMM研究
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

NOSE Takashi其他文献

Spoken Term Detection of Zero-Resource Language Using Posteriorgram of Multiple Languages
利用多语言后图的零资源语言口语检测

NOSE Takashi的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('NOSE Takashi', 18)}}的其他基金

Research and development of a Japanese pronunciation training system using average voice morphing
基于平均语音变形的日语发音训练系统的研发
  • 批准号:
    16K13253
  • 财政年份:
    2016
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Challenging Exploratory Research
A study of speech synthesis for achieving synthetic speech with high quality and variability based on hybrid approach
基于混合方法的语音合成研究,以实现高质量和可变性的合成语音
  • 批准号:
    25730106
  • 财政年份:
    2013
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
Study on speech synthesis for humanoid spoken dialog system
仿人口语对话系统语音合成研究
  • 批准号:
    21800020
  • 财政年份:
    2009
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Research Activity Start-up
A Study of Data Base for Computer Historical Museum
计算机历史博物馆数据库的研究
  • 批准号:
    15500156
  • 财政年份:
    2003
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)

相似海外基金

隠れマルコフモデルに基づいた睡眠時ブラキシズム検査における筋電図波形識別の試み
尝试基于隐马尔可夫模型识别睡眠磨牙症测试中的肌电图波形
  • 批准号:
    20K23107
  • 财政年份:
    2020
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Research Activity Start-up
隠れマルコフモデルを用いた自己組織化写像の拡張及びプロモータ配列の推定
使用隐马尔可夫模型扩展自组织映射和启动子序列估计
  • 批准号:
    05J02795
  • 财政年份:
    2005
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
隠れマルコフモデルを用いたウエーブレットによる統計的信号処理とそのインターネット
使用隐马尔可夫模型及其互联网的小波统计信号处理
  • 批准号:
    99F00430
  • 财政年份:
    2001
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
音声認識のための動的特徴を効果的に用いる隠れマルコフモデルに関する研究
有效利用动态特征进行语音识别的隐马尔可夫模型研究
  • 批准号:
    13780274
  • 财政年份:
    2001
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
隠れマルコフモデルを用いた認識ボコーダー極低ビットレート音声符号化-
使用隐马尔可夫模型进行极低比特率语音编码的识别声码器
  • 批准号:
    08780333
  • 财政年份:
    1996
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
隠れマルコフモデルを用いた音声合成-人間のように話す機械の実現に向けて-
使用隐马尔可夫模型的语音合成 - 实现像人类一样说话的机器 -
  • 批准号:
    08750506
  • 财政年份:
    1996
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
隠れマルコフモデルを用いた音声の規則合成-喜怒哀楽の表現を目指して-
使用隐马尔可夫模型规则合成语音 - 旨在表达喜、怒、哀、乐 -
  • 批准号:
    07858043
  • 财政年份:
    1995
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了