Automatic voice building for flexible speech synthesis

自动语音构建,实现灵活的语音合成

基本信息

  • 批准号:
    14380160
  • 负责人:
  • 金额:
    $ 5.95万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
  • 财政年份:
    2002
  • 资助国家:
    日本
  • 起止时间:
    2002 至 2004
  • 项目状态:
    已结题

项目摘要

The increasing availability of large speech databases makes it possible to construct speech synthesis systems, which are referred to as data-driven or corpus-based approach, by applying statistical learning algorithms. These systems, which can be automatically trained, not only generate natural and high quality synthetic speech but also can reproduce voice characteristics of the original speaker. However, to make the whole voice building process fully-automatic, we need to construct speech databases in an automatic way. In this research work, we investigate automatic voice building techniques for an HMM-based speech synthesis system which can synthesize speech with various voice qualities. First, we implemented an GUI-based labeling tool, called PLEd (Prosody and Linguistic Label Editor). Then, in order to construct an automatic voice building system, we have developed an automatic accent labeling technique. It has been shown that by using the developed system, we have successfully label accent information.
随着大型语音数据库的不断增加,人们可以通过应用统计学习算法来构建语音合成系统,这被称为数据驱动或基于语料库的方法。这些系统可以自动训练,不仅可以生成自然和高质量的合成语音,而且可以再现原始说话人的语音特征。然而,为了使整个语音构建过程完全自动化,我们需要以自动的方式构建语音数据库。在这项研究工作中,我们研究了自动语音建设技术的HMM为基础的语音合成系统,可以合成语音与各种语音质量。首先,我们实现了一个基于GUI的标签工具,称为PLEd(韵律和语言标签编辑器)。然后,为了构建一个自动语音构建系统,我们开发了一个自动口音标注技术。实验结果表明,利用该系统,我们成功地标注了口音信息。

项目成果

期刊论文数量(341)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
An HMM-based speech synthesis system applied to English
Minimum classification error interactive training for speaker identification
说话人识别的最小分类误差交互式训练
凝人化音声対話エージェント基本ソフトウェアの開発プロジェクト報告
人性化语音对话代理基础软件开发项目报告
主観評価に基づくHMM感情音声合成
基于主观评价的HMM情感语音合成
コンテキストクラスタリング決定木を用いた話者適応の検討
基于上下文聚类决策树的说话人适应研究
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

TOKUDA Keikhi其他文献

TOKUDA Keikhi的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

相似海外基金

Acoustic parametric modeling of laryngeal voice quality
喉部语音质量的声学参数化建模
  • 批准号:
    24K15013
  • 财政年份:
    2024
  • 资助金额:
    $ 5.95万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
A Comprehensive Psychoacoustic Approach to Voice Quality Perception
语音质量感知的综合心理声学方法
  • 批准号:
    10983526
  • 财政年份:
    2023
  • 资助金额:
    $ 5.95万
  • 项目类别:
Pediatric dysphonia: Multidisciplinary advances to improve voice quality outcomes
儿科发声困难:改善语音质量结果的多学科进展
  • 批准号:
    10407454
  • 财政年份:
    2020
  • 资助金额:
    $ 5.95万
  • 项目类别:
Pediatric dysphonia: Multidisciplinary advances to improve voice quality outcomes
儿科发声困难:改善语音质量结果的多学科进展
  • 批准号:
    10624847
  • 财政年份:
    2020
  • 资助金额:
    $ 5.95万
  • 项目类别:
Pediatric dysphonia: Multidisciplinary advances to improve voice quality outcomes
儿科发声困难:改善语音质量结果的多学科进展
  • 批准号:
    10948160
  • 财政年份:
    2020
  • 资助金额:
    $ 5.95万
  • 项目类别:
Voice quality in contemporary Scotland: perception, gender, & identity
当代苏格兰的语音质量:感知、性别、
  • 批准号:
    2178789
  • 财政年份:
    2018
  • 资助金额:
    $ 5.95万
  • 项目类别:
    Studentship
Research and development of a voice quality enhancing method for alternative vocalizations by a laryngectomized person
喉切除者替代发声的语音质量增强方法的研究与开发
  • 批准号:
    17K00258
  • 财政年份:
    2017
  • 资助金额:
    $ 5.95万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
RI: Medium: Collaborative Research: Variance and Invariance in Voice Quality: Implications for Machine and Human Speaker Identification
RI:媒介:协作研究:语音质量的方差和不变性:对机器和人类说话人识别的影响
  • 批准号:
    1704167
  • 财政年份:
    2017
  • 资助金额:
    $ 5.95万
  • 项目类别:
    Continuing Grant
RI: Medium: Collaborative Research: Variance and Invariance in Voice Quality: Implications for Machine and Human Speaker Identification
RI:媒介:协作研究:语音质量的方差和不变性:对机器和人类说话人识别的影响
  • 批准号:
    1704170
  • 财政年份:
    2017
  • 资助金额:
    $ 5.95万
  • 项目类别:
    Continuing Grant
Predicting Voice Quality in ASD from Early Markers of Vocal Development
从发声发展的早期标志预测自闭症谱系障碍 (ASD) 的语音质量
  • 批准号:
    9316586
  • 财政年份:
    2016
  • 资助金额:
    $ 5.95万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了