HCC: Medium: Synthesis and Perception of Speaker Identity

HCC:媒介:说话者身份的综合和感知

基本信息

  • 批准号:
    0964468
  • 负责人:
  • 金额:
    $ 91.48万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2010
  • 资助国家:
    美国
  • 起止时间:
    2010-05-15 至 2015-04-30
  • 项目状态:
    已结题

项目摘要

This proposal addresses the problem of synthesizing speaker identity when only a small training sample is available. To achieve the goal of synthesis of speaker identity from a small training corpus the project will address problems including trainable abstract parameterizations of the prosodic patterns that characterize a speaker and voice conversion methods. The project falls into the general category of building Text-to-Speech (TTS) synthesis system in order to generate speech that sounds like that of a specific individual (Speaker Identity Synthesis, or SIS). Systems of this kind have numerous applications, including the creation of personalized voices for individuals with neurodegenerative disorders who anticipate becoming users of Speech Generating Devices (Sods) in the future and many other applications in the consumer products and entertainment industry. Consumer products such as navigation systems and mobile phones are rapidly being developed that make use of linguistic information about generated utterance. The project will also provide new tools and data for human perception of speaker identity. The tools developed in the process and the associated perceptual studies are also relevant for assessment of speaker recognition systems, and the project provides a new generation of concise, trainable characterizations of a speaker?s prosodic patterns that can be incorporated in these systems. The proposed study will elucidate the trade-offs and algorithm issues of the proposed SIS systems and it is likely that the proposed work will have a strong intellectual impact in the field of speech synthesis.
该方法解决了在训练样本较少的情况下合成说话人身份的问题。 为了实现从一个小的训练语料库合成说话人身份的目标,该项目将解决的问题,包括可训练的抽象参数化的韵律模式,表征一个说话人和语音转换方法。 该项目福尔斯属于一般类别的建设文本到语音(TTS)合成系统,以产生语音,听起来像一个特定的个人(发言人身份合成,或SIS)。 这类系统具有许多应用,包括为患有神经退行性疾病的个体创建个性化语音,这些个体预期在未来成为语音生成设备(SOD)的用户,以及消费产品和娱乐行业中的许多其他应用。 诸如导航系统和移动的电话之类的消费产品正在迅速开发,其利用关于所生成的话语的语言信息。该项目还将为人类感知说话人身份提供新的工具和数据。 在这个过程中开发的工具和相关的感知研究也相关的评估扬声器识别系统,该项目提供了一个新一代的简洁,可训练的表征扬声器?的韵律模式,可以纳入这些系统。 拟议的研究将阐明拟议的SIS系统的权衡和算法问题,很可能拟议的工作将在语音合成领域产生强大的智力影响。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Alexander Kain其他文献

Alexander Kain的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Alexander Kain', 18)}}的其他基金

RI: Medium: Collaborative Research: Semi-Supervised Discriminative Training of Language Models
RI:媒介:协作研究:语言模型的半监督判别训练
  • 批准号:
    0964102
  • 财政年份:
    2010
  • 资助金额:
    $ 91.48万
  • 项目类别:
    Continuing Grant
Collaborative Research: CDI-Type I: Computational Models for the Automatic Recognition of Non-Human Primate Social Behaviors
合作研究:CDI-Type I:自动识别非人类灵长类动物社会行为的计算模型
  • 批准号:
    1027834
  • 财政年份:
    2010
  • 资助金额:
    $ 91.48万
  • 项目类别:
    Standard Grant
RI: Small: Modeling Coarticulation for Automatic Speech Recognition
RI:小型:自动语音识别的协同发音建模
  • 批准号:
    0915754
  • 财政年份:
    2009
  • 资助金额:
    $ 91.48万
  • 项目类别:
    Continuing Grant
HCC: High-Quality Compression, Enhancement, and Personalization of Text-to-Speech Voices
HCC:文本转语音的高质量压缩、增强和个性化
  • 批准号:
    0713617
  • 财政年份:
    2007
  • 资助金额:
    $ 91.48万
  • 项目类别:
    Continuing Grant
STTR Phase I: Small Footprint Speech Synthesis
STTR 第一阶段:小规模语音合成
  • 批准号:
    0441125
  • 财政年份:
    2005
  • 资助金额:
    $ 91.48万
  • 项目类别:
    Standard Grant

相似海外基金

Collaborative Research: SHF: Medium: Differentiable Hardware Synthesis
合作研究:SHF:媒介:可微分硬件合成
  • 批准号:
    2403134
  • 财政年份:
    2024
  • 资助金额:
    $ 91.48万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Medium: Differentiable Hardware Synthesis
合作研究:SHF:媒介:可微分硬件合成
  • 批准号:
    2403135
  • 财政年份:
    2024
  • 资助金额:
    $ 91.48万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Core: Medium: Program Synthesis for Schema Changes
协作研究:SHF:核心:媒介:模式更改的程序综合
  • 批准号:
    2210831
  • 财政年份:
    2022
  • 资助金额:
    $ 91.48万
  • 项目类别:
    Standard Grant
SHF: Medium: Automating High Level Synthesis via Graph-Centric Deep Learning
SHF:中:通过以图为中心的深度学习实现高级综合自动化
  • 批准号:
    2211557
  • 财政年份:
    2022
  • 资助金额:
    $ 91.48万
  • 项目类别:
    Continuing Grant
Collaborative Research: CNS Core: Medium: Robust Behavioral Analysis and Synthesis of Network Control Protocols Using Formal Verification
合作研究:CNS 核心:中:使用形式验证的网络控制协议的鲁棒行为分析和综合
  • 批准号:
    2212102
  • 财政年份:
    2022
  • 资助金额:
    $ 91.48万
  • 项目类别:
    Standard Grant
Collaborative Research: CNS Core: Medium: Robust Behavioral Analysis and Synthesis of Network Control Protocols Using Formal Verification
合作研究:CNS 核心:中:使用形式验证的网络控制协议的鲁棒行为分析和综合
  • 批准号:
    2212103
  • 财政年份:
    2022
  • 资助金额:
    $ 91.48万
  • 项目类别:
    Standard Grant
CNS Core: Medium: Automated IoT Safety and Security Analysis and Synthesis
CNS 核心:中:自动化物联网安全分析与综合
  • 批准号:
    2320882
  • 财政年份:
    2022
  • 资助金额:
    $ 91.48万
  • 项目类别:
    Continuing Grant
Collaborative Research: CPS: Medium: ASTrA: Automated Synthesis for Trustworthy Autonomous Utility Services
合作研究:CPS:媒介:ASTrA:值得信赖的自治公用事业服务的自动合成
  • 批准号:
    2139713
  • 财政年份:
    2022
  • 资助金额:
    $ 91.48万
  • 项目类别:
    Standard Grant
Collaborative Research: CPS: Medium: ASTrA: Automated Synthesis for Trustworthy Autonomous Utility Services
合作研究:CPS:媒介:ASTrA:值得信赖的自治公用事业服务的自动合成
  • 批准号:
    2139781
  • 财政年份:
    2022
  • 资助金额:
    $ 91.48万
  • 项目类别:
    Standard Grant
CIF: Medium: Coding Theory for DNA Storage: Synthesis, Retention, and Reconstruction
CIF:媒介:DNA 存储编码理论:合成、保留和重建
  • 批准号:
    2212437
  • 财政年份:
    2022
  • 资助金额:
    $ 91.48万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了