Noise-Adaptive Statistical Speech Synthesis in Varying Acoustic Environments
不同声学环境中的噪声自适应统计语音合成
基本信息
- 批准号:25880027
- 负责人:
- 金额:$ 1.75万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Research Activity Start-up
- 财政年份:2013
- 资助国家:日本
- 起止时间:2013-08-30 至 2015-03-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
近年研究開発が積極的になされている統計モデルに基づく音声合成は、クリーン環境下において、人間の自然音声と同レベルの明瞭性を実現できるようになってきている。本研究では、環境ノイズが人間の音声生成および聴覚に与える影響を調べ、その知見をもとに、様々な騒音下で音声合成システムの明瞭性を自動的かつ適応的に改善する手法の実現を目指した。この目的のため、騒音下で見られるロンバード効果を伴った音声を収録した。また騒音下でノイズによるマスキング効果等を考慮し、明瞭性を自動予測するGlimpseという聴覚モデルを導入し、音声合成システムのスペクトルパラメータを、この聴覚モデルに基づき、自動的かつ適応的に変化させる手法を提案し、音声合成システムの明瞭性が改善することを確かめた。
In recent years, research has been developed on the development of statistical methods for the synthesis of basic sound and sound, and the realization of the clarity of natural sound and sound in human beings under different environmental conditions. This study aims to provide guidance on how to improve the clarity of sound-to-sound synthesis system automatically and appropriately under the conditions of environment and environment. The purpose of this is to record the sound of the sound. In addition, we will consider the effect of the sound, the clarity, the automatic prediction, the introduction of the sound synthesis, the selection of the sound synthesis, the improvement of the clarity, and the improvement of the sound synthesis.
项目成果
期刊论文数量(2)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Using neighbourhood density and selective SNR boosting to increase the intelligibility of synthetic speech in noise
使用邻域密度和选择性 SNR 增强来提高噪声中合成语音的清晰度
- DOI:
- 发表时间:2013
- 期刊:
- 影响因子:0
- 作者:Cassia Valentini-Botinhao;Mirjam Wester;Junichi Yamagishi;and Simon King
- 通讯作者:and Simon King
Intelligibility enhancement of HMM-generated speech in additive noise by modifying Mel cepstral coefficients to increase the glimpse proportion
通过修改梅尔倒谱系数来增加瞥见比例,增强 HMM 生成的语音在加性噪声中的清晰度
- DOI:10.1016/j.csl.2013.06.001
- 发表时间:2014
- 期刊:
- 影响因子:4.3
- 作者:Cassia Valentini-Botinhao;Junichi Yamagishi;Simon King;Ranniery Maia
- 通讯作者:Ranniery Maia
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
山岸 順一其他文献
隠れセミマルコフモデルに基づく適応学習アルゴリズム
基于隐半马尔可夫模型的自适应学习算法
- DOI:
- 发表时间:
2005 - 期刊:
- 影响因子:0
- 作者:
磯貝朱里;山岸順一;小林隆夫;山岸 順一;山岸 順一;山岸 順一 - 通讯作者:
山岸 順一
MLLR adaptation for hidden semi-Markov model based speech synthesis
基于隐半马尔可夫模型的语音合成的 MLLR 自适应
- DOI:
- 发表时间:
2004 - 期刊:
- 影响因子:0
- 作者:
磯貝朱里;山岸順一;小林隆夫;山岸 順一;山岸 順一;山岸 順一;橘 誠;磯貝 朱里;野村 大輔;山岸 順一 - 通讯作者:
山岸 順一
隠れセミマルコフモデルに基づく音声合成システムにおける最尤線形回帰よるスタイル適応の検討
基于隐半马尔可夫模型的语音合成系统中最大似然线性回归的风格适应研究
- DOI:
- 发表时间:
2004 - 期刊:
- 影响因子:0
- 作者:
磯貝朱里;山岸順一;小林隆夫;山岸 順一;山岸 順一;山岸 順一;橘 誠;磯貝 朱里;野村 大輔;山岸 順一;山岸 順一;山岸 順二 - 通讯作者:
山岸 順二
隠れセミマルコフモデルに基づく音声合成システムにおける最尤線形回帰の検討
基于隐半马尔可夫模型的语音合成系统最大似然线性回归研究
- DOI:
- 发表时间:
2004 - 期刊:
- 影响因子:0
- 作者:
磯貝朱里;山岸順一;小林隆夫;山岸 順一;山岸 順一;山岸 順一;橘 誠;磯貝 朱里;野村 大輔;山岸 順一;山岸 順一;山岸 順二;山岸 順一 - 通讯作者:
山岸 順一
ヘッドマウントディスプレイの基礎,研究開発動向と今後の展望
头戴式显示器的基础知识、研发趋势及未来展望
- DOI:
- 发表时间:
2022 - 期刊:
- 影响因子:0
- 作者:
田邉稜;平川翼;山下隆義;藤吉弘亘;山岡憲太郎,小出 蓮,池井 寧,Yem Vibol,雨宮智浩,北崎充晃;Erika Sasaki;山岸 順一;清川 清 - 通讯作者:
清川 清
山岸 順一的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('山岸 順一', 18)}}的其他基金
Explainable next-generation media forensics technologies based on fake media detection and automatic fact verification
基于虚假媒体检测和自动事实验证的可解释的下一代媒体取证技术
- 批准号:
21H04906 - 财政年份:2021
- 资助金额:
$ 1.75万 - 项目类别:
Grant-in-Aid for Scientific Research (A)
任意の話者性・感情表現・発話様式によるテキスト音声合成の実現
实现任意说话人特征、情绪表达、说话风格的文本语音合成
- 批准号:
04J04633 - 财政年份:2004
- 资助金额:
$ 1.75万 - 项目类别:
Grant-in-Aid for JSPS Fellows
相似国自然基金
基于MFSD2A调控血迷路屏障跨细胞囊泡转运机制的噪声性听力损失防治研究
- 批准号:82371144
- 批准年份:2023
- 资助金额:49.00 万元
- 项目类别:面上项目
cGAS-STING激活IFN1反应介导噪声性耳蜗损伤机制研究
- 批准号:82371152
- 批准年份:2023
- 资助金额:49.00 万元
- 项目类别:面上项目
新一代超声速客机起降阶段增升装置气动噪声产生机理及控制方法研究(NOISE)
- 批准号:12261131502
- 批准年份:2022
- 资助金额:105.00 万元
- 项目类别:国际(地区)合作与交流项目
介观输运中量子涨落性质的研究
- 批准号:10347003
- 批准年份:2003
- 资助金额:8.0 万元
- 项目类别:专项基金项目
相似海外基金
Leveraging Natural Language Processing for Reverberant Speech Enhancement in Cochlear Implants
利用自然语言处理增强人工耳蜗的混响语音
- 批准号:
10755798 - 财政年份:2023
- 资助金额:
$ 1.75万 - 项目类别:
Genetic Architecture of Tinnitus and its Relationship to Hearing Loss
耳鸣的遗传结构及其与听力损失的关系
- 批准号:
10480553 - 财政年份:2022
- 资助金额:
$ 1.75万 - 项目类别:
Physiological markers of listening effort and their dependence on age
听力努力的生理标志及其对年龄的依赖性
- 批准号:
10705844 - 财政年份:2022
- 资助金额:
$ 1.75万 - 项目类别:
Genetic Architecture of Tinnitus and its Relationship to Hearing Loss
耳鸣的遗传结构及其与听力损失的关系
- 批准号:
10656407 - 财政年份:2022
- 资助金额:
$ 1.75万 - 项目类别:
Hear What I Want: an Acoustically Smart Personalized Common Room
听到我想要的:声学智能的个性化公共休息室
- 批准号:
10484661 - 财政年份:2022
- 资助金额:
$ 1.75万 - 项目类别:
Effects of Age-related Cochlear Synaptopathy on Speech-in-noise Intelligibility: A Cross-species Approach
年龄相关的耳蜗突触病对噪声中语音清晰度的影响:跨物种方法
- 批准号:
10579924 - 财政年份:2022
- 资助金额:
$ 1.75万 - 项目类别:
Genomic effects of chronic neurotrauma on hearing loss; relationship between hearing loss, TBI, mild cognitive impairment, and dementia
慢性神经创伤对听力损失的基因组影响;
- 批准号:
10536525 - 财政年份:2022
- 资助金额:
$ 1.75万 - 项目类别:
Effects of Age-related Cochlear Synaptopathy on Speech-in-noise Intelligibility: A Cross-species Approach
年龄相关的耳蜗突触病对噪声中语音清晰度的影响:跨物种方法
- 批准号:
10360725 - 财政年份:2022
- 资助金额:
$ 1.75万 - 项目类别:
Real-time deep learning to improve speech intelligibility in noise
实时深度学习提高噪声中的语音清晰度
- 批准号:
10558196 - 财政年份:2022
- 资助金额:
$ 1.75万 - 项目类别:
Clarity in Motion: A Motion-Tolerant Aid for Selectively Hearing Acoustic Sources
运动清晰度:用于选择性聆听声源的运动耐受辅助设备
- 批准号:
10603657 - 财政年份:2022
- 资助金额:
$ 1.75万 - 项目类别: