RI: Small: A New Voice Source Model: From Glottal Areas to Better Speech Synthesis
RI:Small:一种新的语音源模型:从声门区域到更好的语音合成
基本信息
- 批准号:1018863
- 负责人:
- 金额:$ 45万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Continuing Grant
- 财政年份:2010
- 资助国家:美国
- 起止时间:2010-09-01 至 2015-07-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
The goal of the proposed research is to develop and evaluate a new voicesource model based on physiological observations of the vocal folds of 30 adult speakers. Shortcomings of existing source models can be in part attributed to the way in which they were developed: based on limited data from a few speakers, without direct physiological observations, and without perceptual validation. A larger dataset would help in not only developing a source model that could account for a range of voice qualities within and across speakers, but also result in an understanding of how and which model parameter(s) are speaker and/or gender specific. Model development will consider the perceptual effects of the model's parameters from the earliest stages.A better source model might also improve the performance of speech processing algorithms such as text-to-speech synthesis (TTS). Typically in the development of such algorithms, the emphasis has been on acoustic features related to the speech spectral envelope. The acoustics of the voice source, on the other hand, have received less attention. The proposed work involves: 1) recording high-speed images of vocal foldvibrations with simultaneous audio recordings from 15 male and 15 female speakers, 2) extracting glottal area functions from the images to parameterize a new voice source model, 3) performing perception experiments to uncover which model parameters are perceptually salient, and 4) using the new voice source model in TTS. The project's interdisciplinary team (with expertise in modeling, synthesis, recognition, phonetics, and psycholinguistics) is uniquely qualified to conduct this transformative research.
该研究的目的是开发和评估一种新的基于30名成人扬声器的声带生理观察的声带模型。现有源模型的缺点部分归因于它们的开发方式:基于来自少数说话者的有限数据,没有直接的生理观察,也没有感知验证。一个更大的数据集不仅有助于开发一个可以解释说话者内部和跨说话者的一系列语音质量的源模型,而且还有助于理解模型参数如何以及哪些是说话者和/或性别特定的。模型开发将从最早的阶段考虑模型参数的感知效果。更好的源模型也可能提高语音处理算法的性能,例如文本到语音合成(TTS)。通常在这种算法的开发中,重点是与语音频谱包络相关的声学特征。另一方面,声源的声学特性受到的关注较少。拟议的工作包括:1)记录15名男性和15名女性说话者的声带振动的高速图像和同时的音频记录,2)从图像中提取声门面积函数以参数化新的声源模型,3)进行感知实验以揭示哪些模型参数在感知上是显著的,以及4)将新的声源模型用于TTS。该项目的跨学科团队(具有建模,合成,识别,语音学和心理语言学方面的专业知识)是唯一有资格进行这项变革性研究的团队。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Abeer Alwan其他文献
Modeling auditory perception to improve robust speech recognition
建立听觉感知模型以提高稳健的语音识别能力
- DOI:
- 发表时间:
1997 - 期刊:
- 影响因子:0
- 作者:
B. Strope;Abeer Alwan - 通讯作者:
Abeer Alwan
Unraveling the associations between voice pitch and major depressive disorder: a multisite genetic study
揭示声音音调与重度抑郁症之间的关联:一项多站点遗传研究
- DOI:
10.1038/s41380-024-02877-y - 发表时间:
2024-12-31 - 期刊:
- 影响因子:10.100
- 作者:
Yazheng Di;Elior Rahmani;Joel Mefford;Jinhan Wang;Vijay Ravi;Aditya Gorla;Abeer Alwan;Kenneth S. Kendler;Tingshao Zhu;Jonathan Flint - 通讯作者:
Jonathan Flint
Optical Phonetics and Visual Percep Stress in Eng
英语中的光学语音和视觉感知压力
- DOI:
- 发表时间:
2003 - 期刊:
- 影响因子:0
- 作者:
P. Keating;Marco Baroni;Sven Matty;E. T. Auer;Rebecca Scarborough;Abeer Alwan;E. Bernstein - 通讯作者:
E. Bernstein
Towards Automatically Assessing Children’s Picture Description Tasks
自动评估儿童图片描述任务
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
Hariram Veeramani;Natarajan Balaji Shankar;Alexander Johnson;Abeer Alwan - 通讯作者:
Abeer Alwan
An Analysis of Large Language Models for African American English Speaking Children’s Oral Language Assessment
非裔美国英语儿童口语评估大语言模型分析
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
Alexander Johnson;Christina Chance;Kaycee Stiemke;Hariram Veeramani;Natarajan Balaji Shankar;Abeer Alwan - 通讯作者:
Abeer Alwan
Abeer Alwan的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Abeer Alwan', 18)}}的其他基金
Collaborative Research: Improving speech technology for better learning outcomes: the case of AAE child speakers
协作研究:改进语音技术以获得更好的学习成果:AAE 儿童扬声器的案例
- 批准号:
2202585 - 财政年份:2022
- 资助金额:
$ 45万 - 项目类别:
Standard Grant
Collaborative Research: RI: Small: From Ultrasound and MRI to articulatory and acoustic models of child speech development
合作研究:RI:小型:从超声和 MRI 到儿童言语发展的发音和声学模型
- 批准号:
2006979 - 财政年份:2020
- 资助金额:
$ 45万 - 项目类别:
Standard Grant
Workshop for Undergraduate and MS Female Students in Speech Science and Technology
语音科学与技术本科生和女硕士讲习班
- 批准号:
1745166 - 财政年份:2017
- 资助金额:
$ 45万 - 项目类别:
Standard Grant
NRI: INT: COLLAB: Development, Deployment and Evaluation of Personalized Learning Companion Robots for Early Literacy and Language Learning
NRI:INT:COLLAB:用于早期识字和语言学习的个性化学习伴侣机器人的开发、部署和评估
- 批准号:
1734380 - 财政年份:2017
- 资助金额:
$ 45万 - 项目类别:
Standard Grant
RI: Medium: Collaborative Research: Variance and Invariance in Voice Quality: Implications for Machine and Human Speaker Identification
RI:媒介:协作研究:语音质量的方差和不变性:对机器和人类说话人识别的影响
- 批准号:
1704167 - 财政年份:2017
- 资助金额:
$ 45万 - 项目类别:
Continuing Grant
A Workshop for Junior Female Researchers in Speech Science and Technology
语音科学与技术青年女性研究员研讨会
- 批准号:
1637240 - 财政年份:2016
- 资助金额:
$ 45万 - 项目类别:
Standard Grant
The Role of Speech Science in Developing Robust Speech Technology Applications
语音科学在开发强大的语音技术应用中的作用
- 批准号:
1543522 - 财政年份:2015
- 资助金额:
$ 45万 - 项目类别:
Standard Grant
EAGER: Collaborative Research: Models of Child Speech
EAGER:合作研究:儿童言语模型
- 批准号:
1551113 - 财政年份:2015
- 资助金额:
$ 45万 - 项目类别:
Standard Grant
EAGER: Variance and Invariance in Voice Quality
EAGER:语音质量的方差和不变性
- 批准号:
1450992 - 财政年份:2014
- 资助金额:
$ 45万 - 项目类别:
Standard Grant
EAGER: Collaborative Research: Towards Modeling Human Speech Confusions in Noise
EAGER:协作研究:对噪声中的人类语音混乱进行建模
- 批准号:
1247809 - 财政年份:2012
- 资助金额:
$ 45万 - 项目类别:
Standard Grant
相似国自然基金
昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
- 批准号:
- 批准年份:2024
- 资助金额:0.0 万元
- 项目类别:省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
- 批准号:n/a
- 批准年份:2022
- 资助金额:10.0 万元
- 项目类别:省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
- 批准号:32000033
- 批准年份:2020
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
- 批准号:31972324
- 批准年份:2019
- 资助金额:58.0 万元
- 项目类别:面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
- 批准号:81900988
- 批准年份:2019
- 资助金额:21.0 万元
- 项目类别:青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
- 批准号:31870821
- 批准年份:2018
- 资助金额:56.0 万元
- 项目类别:面上项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
- 批准号:31802058
- 批准年份:2018
- 资助金额:26.0 万元
- 项目类别:青年科学基金项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
- 批准号:31772128
- 批准年份:2017
- 资助金额:60.0 万元
- 项目类别:面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
- 批准号:81704176
- 批准年份:2017
- 资助金额:20.0 万元
- 项目类别:青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
- 批准号:91640114
- 批准年份:2016
- 资助金额:85.0 万元
- 项目类别:重大研究计划
相似海外基金
RI: Small: New tools for studying structural and inductive bias in NLP models
RI:小:研究 NLP 模型中的结构和归纳偏差的新工具
- 批准号:
2128145 - 财政年份:2021
- 资助金额:
$ 45万 - 项目类别:
Continuing Grant
RI: Small: New Directions in Probabilistic Deep Learning: Exponential Families, Bayesian Nonparametrics and Empirical Bayes
RI:小:概率深度学习的新方向:指数族、贝叶斯非参数和经验贝叶斯
- 批准号:
2127869 - 财政年份:2021
- 资助金额:
$ 45万 - 项目类别:
Standard Grant
RI: Small: Robotic Path Planning to Reveal Wireless Rays - A New Foundation for the Optimization of Networked Robotic Operations
RI:小型:揭示无线射线的机器人路径规划 - 优化网络机器人操作的新基础
- 批准号:
2008449 - 财政年份:2020
- 资助金额:
$ 45万 - 项目类别:
Standard Grant
RI: Small: A Study of New Aggregate Losses for Machine Learning
RI:小:机器学习新总损失的研究
- 批准号:
2008532 - 财政年份:2020
- 资助金额:
$ 45万 - 项目类别:
Standard Grant
RI: Small: A Study of New Aggregate Losses for Machine Learning
RI:小:机器学习新总损失的研究
- 批准号:
2103450 - 财政年份:2020
- 资助金额:
$ 45万 - 项目类别:
Standard Grant
RI: Small: Collaborative Research: Automatic Creation of New Speech Sound Inventories
RI:小型:协作研究:自动创建新语音库存
- 批准号:
1909075 - 财政年份:2019
- 资助金额:
$ 45万 - 项目类别:
Standard Grant
RI: Small: Collaborative Research: Automatic Creation of New Speech Sound Inventories
RI:小型:协作研究:自动创建新语音库存
- 批准号:
1910319 - 财政年份:2019
- 资助金额:
$ 45万 - 项目类别:
Standard Grant
RI: Small: A New Approach to Integrating Graphical Models in Decision-Theoretic Planning
RI:小型:在决策理论规划中集成图形模型的新方法
- 批准号:
1718384 - 财政年份:2017
- 资助金额:
$ 45万 - 项目类别:
Standard Grant
RI: Small: New Computational Techniques and Market Designs for Kidney Exchanges and Other Barter Markets
RI:小型:肾脏交换和其他易货市场的新计算技术和市场设计
- 批准号:
1718457 - 财政年份:2017
- 资助金额:
$ 45万 - 项目类别:
Standard Grant
RI: Small: New Optical Frontiers for 4D Computational Imaging Systems
RI:小型:4D 计算成像系统的新光学前沿
- 批准号:
1617794 - 财政年份:2016
- 资助金额:
$ 45万 - 项目类别:
Standard Grant