HCC: Small: Modeling Acoustic and Articulatory Features for Hybrid Synthesis

HCC:小型:混合合成的声学和发音特征建模

基本信息

  • 批准号:
    1116799
  • 负责人:
  • 金额:
    $ 18.09万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2011
  • 资助国家:
    美国
  • 起止时间:
    2011-10-01 至 2014-09-30
  • 项目状态:
    已结题

项目摘要

In recent decades synthetic speech has become a ubiquitous and increasingly seamless aspect of human-machine interfaces. Although cars, microwaves, phones, and kiosks all "talk" in human-like ways, the naturalness and personality of these voices fall short of human expression. While this may not matter for many text-to-speech (TTS) applications, over two million Americans with severe speech-motor impairments require assistive communication aids with TTS output. Concatenative TTS synthesizers yield highly intelligible voices, yet many assistive devices rely on small footprint, formant synthesis that sounds robotic and has poor intelligibility. Moreover, the choice of voices on conventional devices is limited and does not reflect the user; it is not uncommon for a child to use the same voice her whole life and for her peers to share that same voice even when using different devices. This lack of attention to the individuality of synthetic voices has consequences on adoption of assistive technology as an extension of the user, and may adversely impact societal attitudes toward the user group.In her prior work the PI began to address these issues by adapting a concatenative synthesizer constructed from acoustic recordings of a healthy talker using vocal source characteristics obtained from a target talker with speech impairment. The adapted voice was highly intelligible and conveyed the target user's identity, yet it also retained substantial elements of the healthy talker's identity due to the influence of vocal tract filter characteristics. This suggests that personalized speech synthesis may be more successful utilizing an alternative approach, in which acoustic and articulatory data from healthy talkers are combined with both source and filter characteristics from target talkers to generate an individualized voice. In this project, the PI will develop hybrid statistical parametric synthesis techniques to model vocal tract and source characteristics of impaired talkers, with the goal of generating highly intelligible and personalized synthetic speech. The PI envisages a future where source and filter parameters of a Hidden Markov Model (HMM) based synthesizer can be adapted to model a child user's vocal tract and modified over time to "grow" with his maturing vocal system, fostering a stronger personal connection between the user and the communication device.Broader Impacts: This project strives to make communication accessible and socially fulfilling by designing an enabling technology that blurs the line between system and user. The human voice is not merely a signal; it has an individualized and personal quality that impacts how others perceive us and how we interact with those around us. The ultimate goal of this work is to afford users of TTS the same ownership and individuality as the natural voice. Project outcomes will have broad impact both on users of assistive aids and able-bodied users of TTS technologies. The research may also lead to a novel and innovative means of assessing the nature and articulatory locus of speech impairment, by comparing model parameters to impaired productions. The interdisciplinary nature of this research will promote teaching, training and learning in computer science and in speech and hearing sciences.
近几十年来,合成语音已成为人机界面中无处不在且日益无缝的一个方面。尽管汽车、微波炉、电话和售货亭都以类似人类的方式“说话”,但这些声音的自然性和个性与人类的表达方式相差甚远。虽然这对许多文本到语音(TTS)的应用来说可能无关紧要,但超过200万有严重语言运动障碍的美国人需要TTS输出的辅助交流辅助。串联TTS合成器产生高度可理解的声音,然而许多辅助设备依赖于小足迹,共振合成,听起来像机器人,具有较差的可理解性。此外,传统设备上的语音选择是有限的,不能反映用户;一个孩子一生都在使用同样的声音,而她的同龄人即使使用不同的设备也会发出同样的声音,这并不罕见。缺乏对合成声音个性的关注会影响辅助技术作为用户延伸的采用,并可能对社会对用户群体的态度产生不利影响。在她之前的工作中,PI开始通过使用一个连接合成器来解决这些问题,该合成器由健康说话者的录音构成,使用从言语障碍的目标说话者那里获得的声源特征。改编后的声音具有高度的可理解性,传达了目标用户的身份,但由于声道过滤器特性的影响,它也保留了健康谈话者身份的大量元素。这表明,利用另一种方法,将健康说话者的声学和发音数据与目标说话者的源和滤波器特征结合起来,生成个性化的声音,个性化的语音合成可能会更成功。在这个项目中,PI将开发混合统计参数合成技术来模拟受损说话者的声道和声源特征,目标是生成高度可理解和个性化的合成语音。PI设想了一个未来,基于隐马尔可夫模型(HMM)的合成器的源和滤波器参数可以适应儿童用户的声道模型,并随着时间的推移进行修改,以随着他成熟的声音系统“成长”,从而在用户和通信设备之间建立更强的个人联系。更广泛的影响:该项目通过设计一种模糊系统和用户之间界限的使能技术,努力使通信变得可访问和社会实现。人类的声音不仅仅是一种信号;它具有个性化和个性化的品质,影响着别人如何看待我们,以及我们如何与周围的人互动。这项工作的最终目标是为TTS用户提供与自然声音相同的所有权和个性。项目成果将对辅助器具使用者和TTS技术的健全使用者产生广泛影响。通过将模型参数与受损产品进行比较,该研究还可能导致一种新的和创新的方法来评估语言障碍的性质和发音轨迹。这项研究的跨学科性质将促进计算机科学和语言与听力科学的教学、培训和学习。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Rupal Patel其他文献

Su1096 - 96-Hour Esophageal PH Monitoring: The Tiebreaker for Abnormal Demeester Score and Symptom Index
Su1096 - 96 小时食管 PH 监测:Demeester 评分和症状指数异常的决胜局
  • DOI:
    10.1016/s0016-5085(18)31852-3
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    29.4
  • 作者:
    Rupal Patel;Ambuj Kumar;J. Jacobs;Soojong Chae;J. Richter
  • 通讯作者:
    J. Richter
Mental health and the Gujarati communities : a case study of Leicester
心理健康和古吉拉特社区:莱斯特的案例研究
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Rupal Patel
  • 通讯作者:
    Rupal Patel
Dialect identification, intelligibility ratings, and acceptability ratings of dysarthric speech in two American English dialects.
两种美式英语方言中构音障碍语音的方言识别、清晰度评级和可接受性评级。
  • DOI:
    10.1080/02699206.2023.2301337
  • 发表时间:
    2024
  • 期刊:
  • 影响因子:
    1.2
  • 作者:
    Jacqueline S. Laures;Caitlin Ray Rogers;H. Griffey;Kenneth G Rice;S. Russell;Michael Frankel;Rupal Patel
  • 通讯作者:
    Rupal Patel
Clinical Features , Manometry , Timed Barium Esophagram , and Treatment Outcomes of Patients With Functional and Anatomic Esophagogastic Junction Outflow Obstruction
功能性和解剖性食管胃交界部流出道梗阻患者的临床特征、测压、定时食管钡餐检查和治疗结果
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
    S. Clayton;Rupal Patel;J. Richter
  • 通讯作者:
    J. Richter
The Future Present
未来现在
  • DOI:
    10.1044/leader.ftr1.18012013.36
  • 发表时间:
    2013
  • 期刊:
  • 影响因子:
    0
  • 作者:
    J. Stone;E. Rubel;R. Hillman;M. Cutter;Shannon C. Mauszycki;R. Shannon;J. Fridriksson;B. M. Law;N. Dronkers;Rupal Patel;E. Haacke
  • 通讯作者:
    E. Haacke

Rupal Patel的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Rupal Patel', 18)}}的其他基金

SBIR Phase II: VocaliD - Infusing Unique Vocal Identities into Synthesized Speech
SBIR 第二阶段:VocaliD - 将独特的声音特征注入合成语音中
  • 批准号:
    1555608
  • 财政年份:
    2016
  • 资助金额:
    $ 18.09万
  • 项目类别:
    Standard Grant
SBIR Phase I: VocaliD - Infusing Unique Vocal Identities into Synthesized Speech
SBIR 第一阶段:VocaliD - 将独特的声音特征注入合成语音中
  • 批准号:
    1447995
  • 财政年份:
    2015
  • 资助金额:
    $ 18.09万
  • 项目类别:
    Standard Grant
EAGER: Collaborative Research: Wireless Sensing of Speech Kinematics and Acoustics for Remediation
EAGER:协作研究:用于修复的语音运动学和声学无线传感
  • 批准号:
    1449266
  • 财政年份:
    2014
  • 资助金额:
    $ 18.09万
  • 项目类别:
    Standard Grant
HCC-Small: Displaying Prosodic Text for Reading Aloud with Expression
HCC-Small:显示韵律文本以进行表达朗读
  • 批准号:
    0915527
  • 财政年份:
    2009
  • 资助金额:
    $ 18.09万
  • 项目类别:
    Continuing Grant
Adapting a Text-to-Speech Synthesizer to Convey User Identity
采用文本转语音合成器来传达用户身份
  • 批准号:
    0712821
  • 财政年份:
    2007
  • 资助金额:
    $ 18.09万
  • 项目类别:
    Continuing Grant
SGER: Loudmouth - Toward Intelligible Speech Synthesis in Everyday Noise Situations
SGER:Loudmouth - 在日常噪声情况下实现可理解的语音合成
  • 批准号:
    0509935
  • 财政年份:
    2005
  • 资助金额:
    $ 18.09万
  • 项目类别:
    Standard Grant

相似国自然基金

昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
  • 批准号:
    n/a
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
  • 批准号:
    32000033
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
  • 批准号:
    31972324
  • 批准年份:
    2019
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
  • 批准号:
    81900988
  • 批准年份:
    2019
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
  • 批准号:
    31870821
  • 批准年份:
    2018
  • 资助金额:
    56.0 万元
  • 项目类别:
    面上项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
  • 批准号:
    31802058
  • 批准年份:
    2018
  • 资助金额:
    26.0 万元
  • 项目类别:
    青年科学基金项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
  • 批准号:
    31772128
  • 批准年份:
    2017
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
  • 批准号:
    81704176
  • 批准年份:
    2017
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
  • 批准号:
    91640114
  • 批准年份:
    2016
  • 资助金额:
    85.0 万元
  • 项目类别:
    重大研究计划

相似海外基金

HCC: Small: Toward Computational Modeling of Autism Spectrum Disorder: Multimodal Data Collection, Fusion, and Phenotyping
HCC:小型:自闭症谱系障碍的计算模型:多模式数据收集、融合和表型分析
  • 批准号:
    2401748
  • 财政年份:
    2023
  • 资助金额:
    $ 18.09万
  • 项目类别:
    Standard Grant
HCC: Small: Modeling Ad Hoc Collaboration on Complex Manipulation Tasks for Human-Robot Teams
HCC:小型:为人机团队的复杂操作任务建模临时协作
  • 批准号:
    2141335
  • 财政年份:
    2022
  • 资助金额:
    $ 18.09万
  • 项目类别:
    Standard Grant
HCC: Small: Toward Computational Modeling of Autism Spectrum Disorder: Multimodal Data Collection, Fusion, and Phenotyping
HCC:小型:自闭症谱系障碍的计算模型:多模式数据收集、融合和表型分析
  • 批准号:
    2114644
  • 财政年份:
    2021
  • 资助金额:
    $ 18.09万
  • 项目类别:
    Standard Grant
HCC: Small: Modeling Human Communication Dynamics
HCC:小型:模拟人类沟通动态
  • 批准号:
    1523495
  • 财政年份:
    2015
  • 资助金额:
    $ 18.09万
  • 项目类别:
    Standard Grant
HCC: Small: Modeling and Supporting Creativity During Collaborative STEM Activities
HCC:小:在协作 STEM 活动中建模和支持创造力
  • 批准号:
    1505223
  • 财政年份:
    2014
  • 资助金额:
    $ 18.09万
  • 项目类别:
    Standard Grant
HCC: Small: Modeling and Supporting Creativity During Collaborative STEM Activities
HCC:小:在协作 STEM 活动中建模和支持创造力
  • 批准号:
    1319645
  • 财政年份:
    2013
  • 资助金额:
    $ 18.09万
  • 项目类别:
    Standard Grant
HCC: Small: Modeling the Validity and Transfer of Eye-Scanning Patterns for Hazard Perception from Virtual Reality Training Environments to Reality
HCC:小型:对从虚拟现实训练环境到现实的危险感知的眼睛扫描模式的有效性和迁移进行建模
  • 批准号:
    1116378
  • 财政年份:
    2011
  • 资助金额:
    $ 18.09万
  • 项目类别:
    Standard Grant
HCC: Small: Modeling Human Communication Dynamics
HCC:小型:模拟人类沟通动态
  • 批准号:
    1118018
  • 财政年份:
    2011
  • 资助金额:
    $ 18.09万
  • 项目类别:
    Standard Grant
HCC: SMALL: Modeling and Exploiting Interaction Context in 3D User Interfaces
HCC:SMALL:在 3D 用户界面中建模和利用交互上下文
  • 批准号:
    0914976
  • 财政年份:
    2009
  • 资助金额:
    $ 18.09万
  • 项目类别:
    Standard Grant
HCC-Small: Modeling Student Affect in Game-Based Learning Environments
HCC-Small:在基于游戏的学习环境中模拟学生的影响
  • 批准号:
    0812291
  • 财政年份:
    2008
  • 资助金额:
    $ 18.09万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了