Expressive Multi-language Speech Synthesis Based on the Generation Process Model and Its Use for Automatic Speech Translation

基于生成过程模型的表达性多语言语音合成及其在自动语音翻译中的应用

基本信息

  • 批准号:
    21300061
  • 负责人:
  • 金额:
    $ 11.23万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
  • 财政年份:
    2009
  • 资助国家:
    日本
  • 起止时间:
    2009 至 2011
  • 项目状态:
    已结题

项目摘要

A unified study on prosody control for multi-languages was conductedbased on the generation process model of fundamental frequency contours(F_0 model). We developeda method of prosody adaptation, where differences in F_0 model commands were learned from parallelspeech corpus and were applied to baseline speech. Focus control, style conversion and voiceconversion were realized. Furthermore, by approximating F_0 contours of training speech corpusand/or generated F_0 contours using the F_0 model, we improved the quality of synthetic speech by theHMM-based speech synthesis. Also, we added focus control. Based on the above results, experiments were conducted on conveying discourse information and intentions in speech Translation.
基于基频轮廓生成过程模型(F_0模型),对多语言韵律控制进行了统一研究。我们开发了一种韵律自适应方法,其中F_0模型命令的差异是从平行语音语料库中学习的,并应用于基线语音。实现了聚焦控制、风格转换和图像转换。此外,通过对训练语音库的F_0轮廓线进行逼近和/或利用F_0模型生成F_0轮廓线,我们改进了基于HMM的语音合成的质量。此外,我们还增加了焦点控制。基于以上结果,本文对言语翻译中语篇信息和意图的传递进行了实验。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
HMM-based F_0 contour synthesis using the generation process model
基于HMM的F_0轮廓合成使用生成过程模型
Adaptation of prosody in speech synthesis by changing command values of the generation process model of fundamental frequency
通过改变基频生成过程模型的命令值来适应语音合成中的韵律
  • DOI:
  • 发表时间:
    2011
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Keikichi Hirose;Keiko Ochi;Ryusuke Mihara;Hiroya Hashimoto;Daisuke Saito;and Nobuaki Minematsu
  • 通讯作者:
    and Nobuaki Minematsu
On the prosodic features for emotional speech
论情感言语的韵律特征
  • DOI:
  • 发表时间:
    2009
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Keikichi Hirose;Qinghua Sun
  • 通讯作者:
    Qinghua Sun
Control of prosodic features in corpus-based generation of fundamental frequency contours based on the generation process model
基于生成过程模型的基频轮廓语料库生成中韵律特征的控制
  • DOI:
  • 发表时间:
    2010
  • 期刊:
  • 影响因子:
    0
  • 作者:
    郡山知樹;能勢隆;小林隆夫;相澤彰子;Keikichi Hirose
  • 通讯作者:
    Keikichi Hirose
Improved generation of fundamental frequency in HMM-based speech synthesis using generation process model
使用生成过程模型改进基于 HMM 的语音合成中基频的生成
  • DOI:
  • 发表时间:
    2010
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Miaomiao Wang;Miaomiao Wen;Keikichi Hirose;and Nobuaki Minematsu
  • 通讯作者:
    and Nobuaki Minematsu
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

HIROSE Keikichi其他文献

HIROSE Keikichi的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('HIROSE Keikichi', 18)}}的其他基金

Pronunciation education system based on the systematization of non-mothor tongue speech prosody using generation process model and speech synthesis
基于生成过程模型和语音合成的非母语语音韵律系统化的发音教育系统
  • 批准号:
    24652115
  • 财政年份:
    2012
  • 资助金额:
    $ 11.23万
  • 项目类别:
    Grant-in-Aid for Challenging Exploratory Research
Advanced method of prosody control in statistical-based speech synthesis using generation process model of fundamental frequency contours
使用基频轮廓生成过程模型的基于统计的语音合成中韵律控制的先进方法
  • 批准号:
    24300068
  • 财政年份:
    2012
  • 资助金额:
    $ 11.23万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Synthesis of speech in any speaking styles based on corpus-based generation of prosodic features using the generation process model
使用生成过程模型基于语料库生成韵律特征来合成任何说话风格的语音
  • 批准号:
    17300055
  • 财政年份:
    2005
  • 资助金额:
    $ 11.23万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
High-quality Speech Synthesis based on Accurate Analysis Method and Statistical Method
基于精确分析方法和统计方法的高质量语音合成
  • 批准号:
    12480079
  • 财政年份:
    2000
  • 资助金额:
    $ 11.23万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Naturally Sounding Speech Synthesis and Recognition Based on the Formulation of Prosody
基于韵律表述的自然语音合成与识别
  • 批准号:
    09480061
  • 财政年份:
    1997
  • 资助金额:
    $ 11.23万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Develoment of Spoken Dialogue System for Japanese and Chinese
日汉口语对话系统的开发
  • 批准号:
    08558028
  • 财政年份:
    1996
  • 资助金额:
    $ 11.23万
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)
Formulation of Prosodic Features of Speech and its Application to Continuous Speech Recognition
语音韵律特征的制定及其在连续语音识别中的应用
  • 批准号:
    06452397
  • 财政年份:
    1994
  • 资助金额:
    $ 11.23万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Rule-Synthesis of Spoken Sentences for the Speech Dialogue Systems
语音对话系统的口语句子规则合成
  • 批准号:
    03452288
  • 财政年份:
    1991
  • 资助金额:
    $ 11.23万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (B)
Development of Output System of Announcing Speech with Input of Kanji-Kana Sentences
输入汉字假名句子的语音播报输出系统的开发
  • 批准号:
    01850073
  • 财政年份:
    1989
  • 资助金额:
    $ 11.23万
  • 项目类别:
    Grant-in-Aid for Developmental Scientific Research (B).

相似海外基金

中国語基本周波数パターンの分析、定式化と合成手法の開発
中国基频模式分析、合成方法的制定和发展
  • 批准号:
    04F04035
  • 财政年份:
    2004
  • 资助金额:
    $ 11.23万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了