Automatic target cost and database design for unit-selection speech synthesis

用于单元选择语音合成的自动目标成本和数据库设计

基本信息

  • 批准号:
    EP/E031447/1
  • 负责人:
  • 金额:
    $ 35.74万
  • 依托单位:
  • 依托单位国家:
    英国
  • 项目类别:
    Research Grant
  • 财政年份:
    2007
  • 资助国家:
    英国
  • 起止时间:
    2007 至 无数据
  • 项目状态:
    已结题

项目摘要

We propose to replace three components of a typical concatenativespeech synthesiser: the text selection algorithm (what to record forthe database), the target cost function (which units to select fromthe database) and the backoff strategy (what to do when the databasedoes not contain the desired unit).These components are currently designed independently using humanintuition. This is very hard, can only be done by experts, and meansthat each component is unlikely to be optimised with respect to theothers. We propose to base these three components on a singleunderlying model. The model will learn, from data, which speech unitsare perceptually interchangeable. This information will then be usedby the target cost function / backoff strategy, and when selecting thetext to be recorded. The proposed techniques will be implemented inthe Festival 2 speech synthesis system and evaluated using formallistening tests.We break down the research programme into three phases. In Phase 1, wewill gain a deeper understanding of current techniques. In Phase 2, wewill examine techniques for learning just the target cost/backoffstrategy, given an existing voice, then for learning thetext-selection algorithm for a given target cost/backoffstrategy. Finally, in Phase 3, we will devise a method for jointlylearning both together.
我们建议替换典型的串联语音合成器的三个组成部分:文本选择算法(为数据库记录什么),目标成本函数(从数据库中选择哪些单元)和后退策略(当数据库不包含所需单元时该怎么办)。目前,这些组件都是利用人类直觉独立设计的。这是非常困难的,只能由专家来完成,这意味着每个组件都不可能相对于其他组件进行优化。我们建议将这三个组件建立在一个底层模型上。该模型将从数据中学习哪些语音单位在感知上是可互换的。这些信息将被目标成本函数/撤退策略使用,并在选择要记录的文本时使用。提出的技术将在Festival 2语音合成系统中实施,并使用正式的听力测试进行评估。我们把研究计划分为三个阶段。在第一阶段,我们将对当前的技术有更深的理解。在第二阶段,我们将研究针对现有语音学习目标成本/后退策略的技术,然后针对给定目标成本/后退策略学习文本选择算法。最后,在第三阶段,我们将设计一种联合学习两者的方法。

项目成果

期刊论文数量(8)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
The Blizzard Challenge 2008
  • DOI:
    10.21437/blizzard.2008-1
  • 发表时间:
    2008-09
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Simon King;R. Clark;C. Mayo;Vasilis Karaiskos
  • 通讯作者:
    Simon King;R. Clark;C. Mayo;Vasilis Karaiskos
A classifier-based target cost for unit selection speech synthesis trained on perceptual data
  • DOI:
    10.21437/interspeech.2010-72
  • 发表时间:
    2010
  • 期刊:
  • 影响因子:
    0
  • 作者:
    V. Strom;Simon King
  • 通讯作者:
    V. Strom;Simon King
Including Pitch Accent Optionality in Unit Selection Text-to-Speech Synthesis
在单元选择文本到语音合成中包括音调重音选项
  • DOI:
  • 发表时间:
    2008
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Badino, L
  • 通讯作者:
    Badino, L
Investigating festival's target cost function using perceptual experiments
  • DOI:
    10.21437/interspeech.2008-187
  • 发表时间:
    2008
  • 期刊:
  • 影响因子:
    0
  • 作者:
    V. Strom;Simon King
  • 通讯作者:
    V. Strom;Simon King
Festival Multisyn Voices for the 2007 Blizzard Challenge
2007 年暴雪挑战节 Multisyn 之声
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Simon King其他文献

Mel cepstral coefficient modification based on the Glimpse Proportion measure for improving the intelligibility of HMM-generated synthetic speech in noise
基于 Glimpse Proportion 度量的 Mel 倒谱系数修正,用于提高噪声中 HMM 生成的合成语音的可懂度
Improved average-voice-based speech synthesis usinggender-mixed modeling and a parameter generation algorithm considBring GV
使用性别混合建模和参数生成算法改进基于平均语音的语音合成
  • DOI:
  • 发表时间:
    2007
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Junichi Yamagishi;Takao Kobayashi;Steve Renals;Simon King;Heiga Zen;Tomoki Toda;Keiichi Tokuda
  • 通讯作者:
    Keiichi Tokuda
Estimating the spectral envelope of voiced speech using multi-frame analysis
使用多帧分析估计有声语音的频谱包络
  • DOI:
    10.21437/eurospeech.2003-27
  • 发表时间:
    2003
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Y. Shiga;Simon King
  • 通讯作者:
    Simon King
Using HMM-based Speech Synthesis to Reconstruct the Voice of Individuals with Degenerative Speech Disorders
使用基于 HMM 的语音合成重建退行性言语障碍患者的声音
  • DOI:
  • 发表时间:
    2012
  • 期刊:
  • 影响因子:
    0
  • 作者:
    C. Veaux;J. Yamagishi;Simon King
  • 通讯作者:
    Simon King
Explorer Robust TTS Duration Modelling Using DNNs
Explorer 使用 DNN 进行稳健的 TTS 持续时间建模
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    G. Henter;S. Ronanki;O. Watts;M. Wester;Zhizheng Wu;Simon King
  • 通讯作者:
    Simon King

Simon King的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Simon King', 18)}}的其他基金

SCRIPT: Speech Synthesis for Spoken Content Production
SCRIPT:用于语音内容制作的语音合成
  • 批准号:
    EP/P011586/1
  • 财政年份:
    2016
  • 资助金额:
    $ 35.74万
  • 项目类别:
    Research Grant
Automatically-determined Unit Inventories for Unit Selection Text-to-Speech Synthesis
自动确定单位库存,用于单位选择文本到语音合成
  • 批准号:
    EP/D058139/1
  • 财政年份:
    2006
  • 资助金额:
    $ 35.74万
  • 项目类别:
    Research Grant

相似国自然基金

按蚊氨基酸运输蛋白PATH对蚊虫传播疟原虫能力的调控及机制研究
  • 批准号:
    81601793
  • 批准年份:
    2016
  • 资助金额:
    17.0 万元
  • 项目类别:
    青年科学基金项目
应用Target-Seq技术对肉牛生长性状显著关联基因组区域进行精细定位
  • 批准号:
    31402039
  • 批准年份:
    2014
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
基于目标诱导链释放的高灵敏度信号放大技术的构建及食品中毒素检测研究
  • 批准号:
    21275085
  • 批准年份:
    2012
  • 资助金额:
    80.0 万元
  • 项目类别:
    面上项目
全基因组micro-RNA种子区结合序列SNP标志体系与乳腺癌发病风险的关联及相关功能研究
  • 批准号:
    81172762
  • 批准年份:
    2011
  • 资助金额:
    68.0 万元
  • 项目类别:
    面上项目
miR-502与其靶基因SET8在乳腺癌中的功能研究
  • 批准号:
    81071627
  • 批准年份:
    2010
  • 资助金额:
    32.0 万元
  • 项目类别:
    面上项目
miRNA靶位点遗传多态性调控骨质疏松机理研究
  • 批准号:
    31071097
  • 批准年份:
    2010
  • 资助金额:
    36.0 万元
  • 项目类别:
    面上项目
HIV gp41的NHR区新靶点的确证及高效干预
  • 批准号:
    81072676
  • 批准年份:
    2010
  • 资助金额:
    33.0 万元
  • 项目类别:
    面上项目
镉激活神经细胞mTOR通路诱导凋亡及雷帕霉素靶向调控抗凋亡分子机理
  • 批准号:
    30971486
  • 批准年份:
    2009
  • 资助金额:
    31.0 万元
  • 项目类别:
    面上项目
应用蛋白敲除技术降解ErbB家族的抗乳腺癌作用及其机制研究
  • 批准号:
    30901754
  • 批准年份:
    2009
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
非编码小RNA引发mRNA 3'端脱腺苷酸化的机制
  • 批准号:
    30970618
  • 批准年份:
    2009
  • 资助金额:
    32.0 万元
  • 项目类别:
    面上项目

相似海外基金

Gut microbiome-mediated differences within the pre-malignant mammary tissue environment enhance early breast tumor metastasis
恶变前乳腺组织环境中肠道微生物介导的差异增强了早期乳腺肿瘤转移
  • 批准号:
    10594667
  • 财政年份:
    2023
  • 资助金额:
    $ 35.74万
  • 项目类别:
The Gut as a Target to Improve Outcomes in Sepsis
肠道作为改善脓毒症预后的目标
  • 批准号:
    10552403
  • 财政年份:
    2023
  • 资助金额:
    $ 35.74万
  • 项目类别:
Targeting host lipid metabolism to limit tissue damage in necrotizing fasciitis
靶向宿主脂质代谢以限制坏死性筋膜炎的组织损伤
  • 批准号:
    10639904
  • 财政年份:
    2023
  • 资助金额:
    $ 35.74万
  • 项目类别:
REVAMP-PH: REpurposing Valsartan May Protect against Pulmonary Hypertension
REVAMP-PH:重新利用缬沙坦可以预防肺动脉高压
  • 批准号:
    10642368
  • 财政年份:
    2023
  • 资助金额:
    $ 35.74万
  • 项目类别:
Prevention of intracellular infection in diabetic wounds by commensal Staphylococcus epidermidis
共生表皮葡萄球菌预防糖尿病伤口细胞内感染
  • 批准号:
    10679628
  • 财政年份:
    2023
  • 资助金额:
    $ 35.74万
  • 项目类别:
Fixed-Target Platforms for Time-Resolved Crystallography
用于时间分辨晶体学的固定目标平台
  • 批准号:
    10634328
  • 财政年份:
    2023
  • 资助金额:
    $ 35.74万
  • 项目类别:
Dissociating respiratory depression and analgesia via a data-driven model of interacting respiratory and pain networks
通过呼吸和疼痛网络相互作用的数据驱动模型分离呼吸抑制和镇痛
  • 批准号:
    10644300
  • 财政年份:
    2023
  • 资助金额:
    $ 35.74万
  • 项目类别:
Feasibility Trial of a Novel Integrated Mindfulness and Acupuncture Program to Improve Outcomes after Spine Surgery (I-MASS)
旨在改善脊柱手术后效果的新型综合正念和针灸计划的可行性试验(I-MASS)
  • 批准号:
    10649741
  • 财政年份:
    2023
  • 资助金额:
    $ 35.74万
  • 项目类别:
A High-Throughput Screening Platform to Discover RNA Methylation Inhibitors
发现 RNA 甲基化抑制剂的高通量筛选平台
  • 批准号:
    10705980
  • 财政年份:
    2023
  • 资助金额:
    $ 35.74万
  • 项目类别:
Northwestern University O'Brien Kidney National Resource Center
西北大学奥布莱恩肾脏国家资源中心
  • 批准号:
    10754080
  • 财政年份:
    2023
  • 资助金额:
    $ 35.74万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了