Experiments and models of speech recognition across tonal and non-tonal language systems (EMSATON)
跨声调和非声调语言系统的语音识别实验和模型(EMSATON)
基本信息
- 批准号:415895050
- 负责人:
- 金额:--
- 依托单位:
- 依托单位国家:德国
- 项目类别:Research Grants
- 财政年份:2019
- 资助国家:德国
- 起止时间:2018-12-31 至 2022-12-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
Human speech communication is the basis of our culture. Even though the articulation organs and the ear are very similar across all humans, their usage across languages shows high variability in solving the task to effectively communicate not only in quiet, but also under challenging acoustical conditions and for hearing impairment. The current project will shed light on how this is achieved by exploring the acoustic, phonetic and audiological foundations of speech recognition of tonal and non-tonal languages and the ability of current speech recognition models to replicate possible differences in recognition across tonal and non-tonal languages. The main long-term goal of EMSATON is to quantitatively understand the reduction of human speech recognition in noise as being influenced by different talkers and speaking styles (i.e., Lombard speech), different language systems (i.e., tonal languages (Mandarin, Cantonese) vs. Western languages (German, English, Spanish)) and different impairment factors (i.e., type of noise, reverberation, individual hearing impairment).We will exploit and extend the closed-set multilingual Matrix sentence recognition test that can be used to assess speech recognition in a highly comparable way across languages (i.e., 20 languages including German, British and American English, Spanish, and recently Mandarin). We will develop the Matrix test in Cantonese to have a second tonal language as reference and will relate the new tonal language tests to non-tonal languages. We will also investigate the effect of talker by including (bilingual) talkers and the effect of speaking style (normal and Lombard speech with a high production effort). Both objective acoustic-phonetic analysis and speech recognition modelling will be performed to better understand the differences and the importance of different speech cues across different languages (tonal vs. non-tonal), across talkers, and speaking styles. In order to identify relevant factors for (speech-related) differences across very different languages and to evaluate a number of assumptions of existing models like SII, HASPI, STOI or the FADE model, the data across languages, speakers and speaking styles will be used to test the prediction accuracy of current models and to establish a benchmark set of data and predictions.This will provide us with the basis for a quantitative, model-based analysis of the language effect and several underlying factors across two tonal languages (Mandarin, Cantonese) and typical non-tonal languages (German, English, Spanish). A possible outcome might be guidelines for constructing assistive listening and hearing devices in a more language-type-specific way, thus optimizing the respective benefit for tonal and non-tonal language users.
人类的言语交流是我们文化的基础。尽管发音器官和耳朵在所有人类中都非常相似,但它们在不同语言中的使用显示出高度的变异性,不仅在安静的情况下,而且在具有挑战性的声学条件下和听力障碍的情况下解决有效沟通的任务。目前的项目将通过探索声调和非声调语言的语音识别的声学、语音和听力基础,以及现有语音识别模型复制声调和非声调语言在识别方面可能存在的差异的能力,阐明如何实现这一点。EMSATON的主要长期目标是定量地了解不同说话者和说话风格(即隆巴德语言)、不同语言系统(即声调语言(普通话、广东话)与西方语言(德语、英语、西班牙语))和不同损伤因素(即噪声类型、混响、个体听力障碍)对人类在噪声中的语音识别能力的影响。我们将开发和扩展封闭式多语言矩阵句子识别测试,该测试可用于以高度可比的方式评估跨语言的语音识别(即,包括德语、英式和美式英语、西班牙语,最近还有普通话)。我们将发展粤语的矩阵测试,以第二种声调语言作为参考,并将新的声调语言测试与非声调语言联系起来。我们还将调查说话者的效果,包括(双语)说话者和说话风格(正常和隆巴德语言,高产出努力)的效果。将进行客观的声学-语音分析和语音识别建模,以更好地了解不同语言(声调与非声调)、说话者和说话风格之间不同语音提示的差异和重要性。为了找出不同语言(与语音有关的)差异的相关因素,并评估现有模型如SII、HASPI、STOI或FADE模型的一些假设,我们将使用跨语言、说话人和说话风格的数据来测试当前模型的预测准确性,并建立一组基准数据和预测。这将为我们提供基础,以定量的、基于模型的分析两种声调语言(普通话、广东话)和典型的非声调语言(德语、英语、西班牙语)的语言效果和几个潜在因素。一个可能的结果可能是以更具语言类型的方式构建辅助听力和听力设备的指导方针,从而优化对有声调和非有声调语言使用者的各自好处。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Professor Dr. Birger Kollmeier其他文献
Professor Dr. Birger Kollmeier的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Professor Dr. Birger Kollmeier', 18)}}的其他基金
Individualized Hearing Acoustics: Models, algorithms and systems to ensure acoustic perception for all people in all situations
个性化听觉声学:确保所有人在所有情况下的声学感知的模型、算法和系统
- 批准号:
203315698 - 财政年份:2012
- 资助金额:
-- - 项目类别:
Research Units
Auditorische räumliche Abbildung und Mechanismen der binauralen Signalverarbeitung beim Menschen
人类双耳信号处理的听觉空间映射和机制
- 批准号:
14044354 - 财政年份:2005
- 资助金额:
-- - 项目类别:
Research Grants
Psychophysik und Audiologie der schwellennahen Feinstruktur: Grundlagen und Anwendungen zur Früherkennung von Hörschäden (Ototoxizität, Hörsturz, Schalltrauma, Lärmschwerhörigkeit)
阈值附近精细结构的心理物理学和听力学:早期检测听力损伤(耳毒性、突发性听力损失、声损伤、噪声性听力损失)的基础知识和应用
- 批准号:
5436157 - 财政年份:2004
- 资助金额:
-- - 项目类别:
Research Grants
Architektur für die automatische Verlustleistungsminimierung von Signalverarbeitungssystemen
信号处理系统自动功率损耗最小化的架构
- 批准号:
5408151 - 财政年份:2003
- 资助金额:
-- - 项目类别:
Priority Programmes
Methodik und Werkzeuge für den verlustleistungsoptimierten Algorithmen- und Architekturentwurf eingebetteter Systeme für die Verarbeitung von Audio- und Sprachsignalen
用于处理音频和语音信号的嵌入式系统的功耗优化算法和架构设计的方法和工具
- 批准号:
5324238 - 财政年份:2001
- 资助金额:
-- - 项目类别:
Priority Programmes
Noise reduction and auditory processing for robust automatic speech recognition in adverse enviroments.
降噪和听觉处理,可在恶劣环境下实现稳健的自动语音识别。
- 批准号:
5296952 - 财政年份:2001
- 资助金额:
-- - 项目类别:
Research Grants
System- und Schaltungstechnik einer integrierten Cochlea für Sprachanalyse, Spracherkennung und Sprachkodierung mit minimierter Leistungsaufnahme
用于语音分析、语音识别和语音编码的集成耳蜗系统和电路技术,功耗最小
- 批准号:
5303730 - 财政年份:1999
- 资助金额:
-- - 项目类别:
Research Grants
Neubewertung und Weiterentwicklung der Sprachaudiometrie im deutschen Sprachraum
德语区言语听力测试的重新评估和进一步发展
- 批准号:
5095818 - 财政年份:1998
- 资助金额:
-- - 项目类别:
Research Grants
Experimentelle Analyse des Zusammenhangs zwischen otoakustischen Emissionen und psychoakustisch meßbaren Leistungen des Gehörs
耳声发射与心理声学可测量听力表现之间关系的实验分析
- 批准号:
5204002 - 财政年份:1995
- 资助金额:
-- - 项目类别:
Research Grants
German-Russian statistical audiology: Data conditioning and audiological profile analysis for the diagnosis and compensation of hearing impairment” (GRUSTAD)
德国-俄罗斯统计听力学:用于听力障碍诊断和补偿的数据调理和听力档案分析â (GRUSTAD)
- 批准号:
465121786 - 财政年份:
- 资助金额:
-- - 项目类别:
Research Grants
相似国自然基金
Scalable Learning and Optimization: High-dimensional Models and Online Decision-Making Strategies for Big Data Analysis
- 批准号:
- 批准年份:2024
- 资助金额:万元
- 项目类别:合作创新研究团队
河北南部地区灰霾的来源和形成机制研究
- 批准号:41105105
- 批准年份:2011
- 资助金额:25.0 万元
- 项目类别:青年科学基金项目
保险风险模型、投资组合及相关课题研究
- 批准号:10971157
- 批准年份:2009
- 资助金额:24.0 万元
- 项目类别:面上项目
RKTG对ERK信号通路的调控和肿瘤生成的影响
- 批准号:30830037
- 批准年份:2008
- 资助金额:190.0 万元
- 项目类别:重点项目
新型手性NAD(P)H Models合成及生化模拟
- 批准号:20472090
- 批准年份:2004
- 资助金额:23.0 万元
- 项目类别:面上项目
相似海外基金
Dravet Syndrome Anti-Epileptic Control by Targeting GIRK Channels
通过针对 GIRK 通道进行 Dravet 综合征抗癫痫控制
- 批准号:
10638439 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Small animal model for evaluating the impacts of cleft lip repairing scar on craniofacial growth and development
评价唇裂修复疤痕对颅面生长发育影响的小动物模型
- 批准号:
10642519 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Hearing Loss, Prognosis, and Long-Term Impact of Otitis Media with Effusion in Children
儿童渗出性中耳炎的听力损失、预后和长期影响
- 批准号:
10852143 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Changes in apical cochlear mechanics after cochlear implantation
人工耳蜗植入后耳蜗顶端力学的变化
- 批准号:
10730981 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Dynamic neural coding of spectro-temporal sound features during free movement
自由运动时谱时声音特征的动态神经编码
- 批准号:
10656110 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Functional and structural characterization of human auditory cortex using high resolution MRI
使用高分辨率 MRI 表征人类听觉皮层的功能和结构
- 批准号:
10728782 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Characterization of the Neurobiological Profiles of Young Adults with and without Developmental Language Disorder (DLD)
患有和不患有发育性语言障碍 (DLD) 的年轻人的神经生物学特征的表征
- 批准号:
10721464 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Testing the accuracy of eye tracking as a screening tool for ASD in the general population
测试眼动追踪作为普通人群自闭症谱系障碍筛查工具的准确性
- 批准号:
10638066 - 财政年份:2023
- 资助金额:
-- - 项目类别:
DDALAB: Identifying Latent States from Neural Recordings with Nonlinear Causal Analysis
DDALAB:通过非线性因果分析从神经记录中识别潜在状态
- 批准号:
10643212 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Vital capacity & airflow measurement for voice evaluation: A vortex whistle system
肺活量
- 批准号:
10737248 - 财政年份:2023
- 资助金额:
-- - 项目类别:














{{item.name}}会员




