Bayesian Learning of a Hierarchical Representation of Language from Raw Speech
从原始语音中学习语言的分层表示的贝叶斯学习
基本信息
- 批准号:260050394
- 负责人:
- 金额:--
- 依托单位:
- 依托单位国家:德国
- 项目类别:Priority Programmes
- 财政年份:2014
- 资助国家:德国
- 起止时间:2013-12-31 至 2017-12-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
The goal of this project is to learn a hierarchical representation of a language from raw speech input. At the lowest layer the acoustic building blocks of speech, the phonemes or similar sub-word units, are discovered and statistical models learned for them, while the next layer is concerned with the discovery of the lexical building blocks, the words, and learning their probabilities. Finally, semantically interpretable word categories will be built from them. Particular focus is placed on the facts, that the vocabulary in natural languages is in principle unlimited and that the acoustic signal exhibits extreme variability. Both issues will be approached in a Bayesian paradigm. To allow the vocabulary to grow with the amount of input data nonparametric Bayesian statistics, in particular those based on the Dirichlet and the Pitman-Yor processes, will be employed, where the number of parameters need not be specified in advance. The variability of the spoken input, leading to ambiguities at the acoustic unit discovery stage, is accounted for by avoiding premature decisions on the phoneme identity and treating acoustic and lexical variables in a joint probabilistic model, for which efficient inference techniques will be developed. While we envision several applications in the realm of speech processing, the joint or iterative hierarchical Bayesian learning framework to be developed will also be of interest to learning problems on other sequential and highly variable sensory input data.
这个项目的目标是从原始语音输入中学习语言的层次表示。在最低层,语音的声学构建块,音素或类似的子词单元,被发现并为它们学习统计模型,而下一层则涉及词汇构建块,单词的发现,并学习它们的概率。最后,语义可解释的词类别将建立从他们。特别关注的事实,即在自然语言中的词汇原则上是无限的,声学信号表现出极大的变化。这两个问题都将在贝叶斯范式中处理。为了使词汇量随着输入数据量的增长而增长,将采用非参数贝叶斯统计,特别是基于Dirichlet和Pitman-Yor过程的统计,其中参数的数量不需要预先指定。口语输入的变化,导致在声学单元发现阶段的歧义,占通过避免过早的决定音素身份和治疗声学和词汇变量的联合概率模型,将开发有效的推理技术。虽然我们设想在语音处理领域的几个应用程序,联合或迭代层次贝叶斯学习框架的开发也将是其他顺序和高度可变的感官输入数据的学习问题的兴趣。
项目成果
期刊论文数量(3)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Leveraging Text Data for Word Segmentation for Underresourced Languages
- DOI:10.21437/interspeech.2017-1262
- 发表时间:2017-08
- 期刊:
- 影响因子:0
- 作者:Thomas Glarner;Benedikt T. Boenninghoff;Oliver Walter;Reinhold Häb-Umbach
- 通讯作者:Thomas Glarner;Benedikt T. Boenninghoff;Oliver Walter;Reinhold Häb-Umbach
Full Bayesian Hidden Markov Model Variational Autoencoder for Acoustic Unit Discovery
用于声学单元发现的完整贝叶斯隐马尔可夫模型变分自动编码器
- DOI:10.21437/interspeech.2018-2148
- 发表时间:2018
- 期刊:
- 影响因子:0
- 作者:T. Glarner;P. Hanebrink;J. Ebbers;R. Haeb-Umbach
- 通讯作者:R. Haeb-Umbach
Machine learning techniques for semantic analysis of dysarthric speech: An experimental study
- DOI:10.1016/j.specom.2018.04.005
- 发表时间:2018-05-01
- 期刊:
- 影响因子:3.2
- 作者:Despotovic, Vladimir;Walter, Oliver;Haeb-Umbach, Reinhold
- 通讯作者:Haeb-Umbach, Reinhold
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Professor Dr.-Ing. Reinhold Häb-Umbach其他文献
Professor Dr.-Ing. Reinhold Häb-Umbach的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Professor Dr.-Ing. Reinhold Häb-Umbach', 18)}}的其他基金
Source separation and noise reduction for automatic speech recognition in dynamic acoustic scenarios
动态声学场景中自动语音识别的源分离和降噪
- 批准号:
316471544 - 财政年份:2016
- 资助金额:
-- - 项目类别:
Research Grants (Transfer Project)
Sound recognition with limited supervision over sensor networks
对传感器网络的有限监督的声音识别
- 批准号:
318489874 - 财政年份:2016
- 资助金额:
-- - 项目类别:
Research Units
Bayesian feature enhancement for large vocabulary speech recognition in the presence of noise and reverberation
贝叶斯特征增强,适用于存在噪声和混响的情况下的大词汇量语音识别
- 批准号:
235486169 - 财政年份:2013
- 资助金额:
-- - 项目类别:
Research Grants
Sparse Coding Approaches to Language Acquisition
语言习得的稀疏编码方法
- 批准号:
200293401 - 财政年份:2011
- 资助金额:
-- - 项目类别:
Priority Programmes
Ein integrierter Ansatz zur Störgeräuschunterdrückung und blinden Trennung von Sprachsignalen
一种降噪和语音信号盲分离的综合方法
- 批准号:
193484692 - 财政年份:2010
- 资助金额:
-- - 项目类别:
Research Grants
Unsupervised audio-visual geometry calibration of distributed microphone arrays
分布式麦克风阵列的无监督视听几何校准
- 批准号:
166631756 - 财政年份:2010
- 资助金额:
-- - 项目类别:
Research Grants
Ein systematischer Ansatz zur Ausnutzung von Korrelationen aufeinander folgender Merkmalsvektoren in der automatischen Spracherkennung
在自动语音识别中利用连续特征向量相关性的系统方法
- 批准号:
61519056 - 财政年份:2008
- 资助金额:
-- - 项目类别:
Research Grants
Blinde adaptive akustische Strahlformung und Quellentrennung für einen sich bewegenden Sprecher in nichtstationärer akustischer Umgebung
非静止声学环境中移动扬声器的盲自适应声波束形成和源分离
- 批准号:
21317402 - 财政年份:2006
- 资助金额:
-- - 项目类别:
Research Grants
Schätzung und Verwendung von weichen Merkmalsvektoren bei Spracherkennung über Telekommunikationssysteme
电信系统语音识别中软特征向量的估计和使用
- 批准号:
5418396 - 财政年份:2004
- 资助金额:
-- - 项目类别:
Research Grants
相似国自然基金
Scalable Learning and Optimization: High-dimensional Models and Online Decision-Making Strategies for Big Data Analysis
- 批准号:
- 批准年份:2024
- 资助金额:万元
- 项目类别:合作创新研究团队
Understanding structural evolution of galaxies with machine learning
- 批准号:n/a
- 批准年份:2022
- 资助金额:10.0 万元
- 项目类别:省市级项目
煤矿安全人机混合群智感知任务的约束动态多目标Q-learning进化分配
- 批准号:
- 批准年份:2022
- 资助金额:30 万元
- 项目类别:青年科学基金项目
基于领弹失效考量的智能弹药编队短时在线Q-learning协同控制机理
- 批准号:62003314
- 批准年份:2020
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
集成上下文张量分解的e-learning资源推荐方法研究
- 批准号:61902016
- 批准年份:2019
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
具有时序迁移能力的Spiking-Transfer learning (脉冲-迁移学习)方法研究
- 批准号:61806040
- 批准年份:2018
- 资助金额:20.0 万元
- 项目类别:青年科学基金项目
基于Deep-learning的三江源区冰川监测动态识别技术研究
- 批准号:51769027
- 批准年份:2017
- 资助金额:38.0 万元
- 项目类别:地区科学基金项目
具有时序处理能力的Spiking-Deep Learning(脉冲深度学习)方法研究
- 批准号:61573081
- 批准年份:2015
- 资助金额:64.0 万元
- 项目类别:面上项目
基于有向超图的大型个性化e-learning学习过程模型的自动生成与优化
- 批准号:61572533
- 批准年份:2015
- 资助金额:66.0 万元
- 项目类别:面上项目
E-Learning中学习者情感补偿方法的研究
- 批准号:61402392
- 批准年份:2014
- 资助金额:26.0 万元
- 项目类别:青年科学基金项目
相似海外基金
Collaborative Research: An Integrated Framework for Learning-Enabled and Communication-Aware Hierarchical Distributed Optimization
协作研究:支持学习和通信感知的分层分布式优化的集成框架
- 批准号:
2331710 - 财政年份:2024
- 资助金额:
-- - 项目类别:
Standard Grant
Collaborative Research: An Integrated Framework for Learning-Enabled and Communication-Aware Hierarchical Distributed Optimization
协作研究:支持学习和通信感知的分层分布式优化的集成框架
- 批准号:
2331711 - 财政年份:2024
- 资助金额:
-- - 项目类别:
Standard Grant
Transformer-based Framework for Multi-objective Reinforcement Learning using Hierarchical Policies
使用分层策略的基于 Transformer 的多目标强化学习框架
- 批准号:
24K20843 - 财政年份:2024
- 资助金额:
-- - 项目类别:
Grant-in-Aid for Early-Career Scientists
CAREER: Towards Hierarchical and Provably Safe Control for Learning-Enabled Autonomous Systems
职业:为支持学习的自主系统实现分层且可证明安全的控制
- 批准号:
2237850 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Standard Grant
Collaborative Research: CCSS: Hierarchical Federated Learning over Highly-Dense and Overlapping NextG Wireless Deployments: Orchestrating Resources for Performance
协作研究:CCSS:高密度和重叠的 NextG 无线部署的分层联合学习:编排资源以提高性能
- 批准号:
2319780 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Standard Grant
Collaborative Research: CCSS: Hierarchical Federated Learning over Highly-Dense and Overlapping NextG Wireless Deployments: Orchestrating Resources for Performance
协作研究:CCSS:高密度和重叠的 NextG 无线部署的分层联合学习:编排资源以提高性能
- 批准号:
2319781 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Standard Grant
NRI: Hierarchical Representation Learning for Robot Assistants
NRI:机器人助手的分层表示学习
- 批准号:
2405103 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Standard Grant
Excellence in Research: A Hierarchical Machine Learning Approach for Securing of NoC-Based MPSoCs Against Thermal Attacks
卓越的研究:用于保护基于 NoC 的 MPSoC 免受热攻击的分层机器学习方法
- 批准号:
2302537 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Standard Grant
NRI: Hierarchical Representation Learning for Robot Assistants
NRI:机器人助手的分层表示学习
- 批准号:
2132519 - 财政年份:2022
- 资助金额:
-- - 项目类别:
Standard Grant
CAREER: Toward Hierarchical Game Theory and Hybrid Learning Framework for Safe, Efficient Large-scale Multi-agent Systems
职业:面向安全、高效的大规模多智能体系统的分层博弈论和混合学习框架
- 批准号:
2144646 - 财政年份:2022
- 资助金额:
-- - 项目类别:
Continuing Grant