CompCog: Deep causal inference grounds the perception of cognitive objects in speech
CompCog:深层因果推理为语音中认知对象的感知奠定了基础
基本信息
- 批准号:2240349
- 负责人:
- 金额:$ 60万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2023
- 资助国家:美国
- 起止时间:2023-08-15 至 2026-07-31
- 项目状态:未结题
- 来源:
- 关键词:
项目摘要
Artificial Intelligence systems are becoming more and more important in society, and their performance has improved enormously in recent years. Yet, we still do not understand how these systems actually work, and how they emulate human performance, to the extent that they do. In this work, novel methods are developed for probing the inner working of these systems by comparing their internal computations with corresponding computations humans perform. The specific skill we probe is speech recognition—a highly complex process, as speech is a richly variable, information dense, and quickly transmitted medium of communication. One of the ways that the human brain deals with this complexity during speech recognition is by engaging not only brain areas responsible for listening but also areas crucial to the production of speech. This suggests that human cognition is aware of the systems in the world that cause speech—the movements of the lips, tongue, and other vocal organs. Do current artificial intelligence systems also develop such a deep causal understanding of speech? In this work we answer this question by delving into the mathematical models of both human and machine knowledge in these systems. Our work has two major goals. The first is technological: understanding how artificial intelligence systems actually work on the inside, which is ultimately a necessary step in directing their abilities to societal benefit. The second is scientific: before widespread use in society, artificial intelligence systems were developed by cognitive scientists to understand human cognition, and by probing the inner workings of state-of-the-art machine learning as a cognitive model we may be able to better understand how humans perceive speech. In this work, therefore, science and technology further each other, as they have done successfully in the past.This research program specifically probes the relationship between the production and perception of speech in humans and computers. To do so, speakers of three languages (English, Russian, Korean) are imaged using a real time Magnetic Resonance Imaging (MRI), which shows in vivid detail how the speech articulators move. Speaker’s speech audio signals are recorded simultaneously. The data are analyzed using mathematical models of speech production, modern speech recognition systems, and mathematical models of how human neural rhythms analyze speech. Experimental manipulations unveil how the representations in each of the systems corresponds to those in the others. This strategy inform us about the science of human cognition hand-in-hand with illuminating the black-box technology of machine emulation of the human capability. In the future, in addition to advancing science and technology, we anticipate the application of this knowledge to the creation of novel small-sized speech recognition systems that can assist in the documentation of endangered languages.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
人工智能系统在社会上变得越来越重要,近年来它们的性能有了很大的提高。然而,我们仍然不了解这些系统实际是如何工作的,以及它们如何在一定程度上模仿人类的表现。在这项工作中,通过将这些系统的内部计算与人类执行的相应计算进行比较,开发了新的方法来探索这些系统的内部工作。我们探索的具体技能是语音识别--这是一个非常复杂的过程,因为语音是一种变量丰富、信息密集、传输速度快的交流媒介。人类大脑在语音识别过程中处理这种复杂性的方法之一是,不仅让负责倾听的大脑区域参与进来,还让对语音产生至关重要的区域参与进来。这表明,人类的认知意识到了世界上导致说话的系统--嘴唇、舌头和其他发声器官的运动。目前的人工智能系统也开发出了对语音的如此深入的因果理解吗?在这项工作中,我们通过深入研究这些系统中人和机器知识的数学模型来回答这个问题。我们的工作有两个主要目标。第一个是技术:了解人工智能系统实际上是如何在内部工作的,这最终是将其能力引导到社会利益中的必要步骤。第二个是科学的:在广泛应用于社会之前,人工智能系统是由认知科学家开发的,目的是理解人类的认知,通过探索最先进的机器学习的内部工作原理作为一种认知模型,我们可能能够更好地理解人类如何感知言语。因此,在这项工作中,科学和技术相互促进,就像它们在过去所做的那样。这个研究项目专门探索人类和计算机中语音的产生和感知之间的关系。为了做到这一点,使用三种语言(英语、俄语和韩语)的人使用实时磁共振成像(MRI)进行成像,该成像生动地显示了语音发音器是如何运动的。同时记录说话人的语音音频信号。这些数据使用语音产生的数学模型、现代语音识别系统以及人类神经节律如何分析语音的数学模型进行分析。实验操作揭示了每个系统中的表示如何与其他系统中的表示相对应。这一策略让我们了解了人类认知科学,同时也照亮了机器模拟人类能力的黑匣子技术。在未来,除了推动科学和技术的发展,我们预计将这些知识应用于创建新的小型语音识别系统,以帮助记录濒危语言。这一奖项反映了NSF的法定使命,并通过使用基金会的智力优势和更广泛的影响审查标准进行评估,被认为值得支持。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Khalil Iskarous其他文献
A Method of Co‐registering Multiple Magnetic Resonance Imaged Vocal Tract Volumes for Fricatives
一种摩擦音多磁共振成像声带体积的联合配准方法
- DOI:
10.1121/1.2935244 - 发表时间:
2008 - 期刊:
- 影响因子:2.4
- 作者:
M. Proctor;C. Shadle;Khalil Iskarous - 通讯作者:
Khalil Iskarous
Exploring a Choctaw Language Corpus with Word Vectors and Minimum Distance Length
使用词向量和最小距离长度探索乔克托语语料库
- DOI:
- 发表时间:
2020 - 期刊:
- 影响因子:0
- 作者:
Jacqueline Brixey;David J. Sides;Timothy Vizthum;D. Traum;Khalil Iskarous - 通讯作者:
Khalil Iskarous
Locally-weighted regression for estimating the forward kinematics of a geometric vocal tract model
用于估计几何声道模型正向运动学的局部加权回归
- DOI:
10.21437/interspeech.2010-465 - 发表时间:
2010 - 期刊:
- 影响因子:2.4
- 作者:
A. Lammert;L. Goldstein;Khalil Iskarous - 通讯作者:
Khalil Iskarous
Revisiting the role of the sublingual cavity in the /s/‐/∫/ distinction.
重新审视舌下腔在 /s/‐/∫/ 区别中的作用。
- DOI:
10.1121/1.4783735 - 发表时间:
2009 - 期刊:
- 影响因子:2.4
- 作者:
C. Shadle;M. Proctor;Khalil Iskarous;M. A. Berezina - 通讯作者:
M. A. Berezina
9 Speech Production and Perception
9 语音产生和感知
- DOI:
10.1002/9781118133880.hop204009 - 发表时间:
2012 - 期刊:
- 影响因子:0
- 作者:
C. Fowler;Khalil Iskarous - 通讯作者:
Khalil Iskarous
Khalil Iskarous的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Khalil Iskarous', 18)}}的其他基金
REG: Morphological Investigations in Formosan Languages
REG:台湾语言形态学研究
- 批准号:
1219533 - 财政年份:2012
- 资助金额:
$ 60万 - 项目类别:
Standard Grant
INSPIRE: Dynamical Principles of Animal Movement
INSPIRE:动物运动的动力学原理
- 批准号:
1246750 - 财政年份:2012
- 资助金额:
$ 60万 - 项目类别:
Standard Grant
相似国自然基金
基于Deep Unrolling的高分辨近红外二区荧光分子断层成像方法研究
- 批准号:12271434
- 批准年份:2022
- 资助金额:46 万元
- 项目类别:面上项目
基于深度森林(Deep Forest)模型的表面增强拉曼光谱分析方法研究
- 批准号:2020A151501709
- 批准年份:2020
- 资助金额:10.0 万元
- 项目类别:省市级项目
面向Deep Web的数据整合关键技术研究
- 批准号:61872168
- 批准年份:2018
- 资助金额:62.0 万元
- 项目类别:面上项目
基于Deep-learning的三江源区冰川监测动态识别技术研究
- 批准号:51769027
- 批准年份:2017
- 资助金额:38.0 万元
- 项目类别:地区科学基金项目
具有时序处理能力的Spiking-Deep Learning(脉冲深度学习)方法研究
- 批准号:61573081
- 批准年份:2015
- 资助金额:64.0 万元
- 项目类别:面上项目
基于语义计算的海量Deep Web知识探索机制研究
- 批准号:61272411
- 批准年份:2012
- 资助金额:80.0 万元
- 项目类别:面上项目
Deep Web数据集成查询结果抽取与整合关键技术研究
- 批准号:61100167
- 批准年份:2011
- 资助金额:20.0 万元
- 项目类别:青年科学基金项目
面向Deep Web的大规模知识库自动构建方法研究
- 批准号:61170020
- 批准年份:2011
- 资助金额:57.0 万元
- 项目类别:面上项目
Deep Web敏感聚合信息保护方法研究
- 批准号:61003054
- 批准年份:2010
- 资助金额:20.0 万元
- 项目类别:青年科学基金项目
基于逻辑强化学习的Deep Web模式匹配研究
- 批准号:61070122
- 批准年份:2010
- 资助金额:32.0 万元
- 项目类别:面上项目
相似海外基金
Causal contributions of deep prefrontal-amygdala circuits to social cognition
深层前额叶杏仁核回路对社会认知的因果贡献
- 批准号:
MR/Y010477/1 - 财政年份:2024
- 资助金额:
$ 60万 - 项目类别:
Fellowship
Collaborative Research: III: Medium: VirtualLab: Integrating Deep Graph Learning and Causal Inference for Multi-Agent Dynamical Systems
协作研究:III:媒介:VirtualLab:集成多智能体动态系统的深度图学习和因果推理
- 批准号:
2312501 - 财政年份:2023
- 资助金额:
$ 60万 - 项目类别:
Standard Grant
Deep learning to enable the genetic analysis of aorta
深度学习可实现主动脉的遗传分析
- 批准号:
10807379 - 财政年份:2023
- 资助金额:
$ 60万 - 项目类别:
Collaborative Research: III: Medium: VirtualLab: Integrating Deep Graph Learning and Causal Inference for Multi-Agent Dynamical Systems
协作研究:III:媒介:VirtualLab:集成多智能体动态系统的深度图学习和因果推理
- 批准号:
2312502 - 财政年份:2023
- 资助金额:
$ 60万 - 项目类别:
Standard Grant
Applying Causal Inference and Deep Learning to Improve the Accuracy and Equity of Pulmonary Function Test Interpretation.
应用因果推理和深度学习提高肺功能测试解释的准确性和公平性。
- 批准号:
10749527 - 财政年份:2023
- 资助金额:
$ 60万 - 项目类别:
Discovery of novel therapeutic targets for NASH through deep phenotyping of human knockouts and mechanistic studies
通过人类基因敲除的深入表型分析和机制研究发现 NASH 的新治疗靶点
- 批准号:
10698154 - 财政年份:2022
- 资助金额:
$ 60万 - 项目类别:
Discovery of novel therapeutic targets for NASH through deep phenotyping of human knockouts and mechanistic studies
通过人类基因敲除的深入表型分析和机制研究发现 NASH 的新治疗靶点
- 批准号:
10504666 - 财政年份:2022
- 资助金额:
$ 60万 - 项目类别:
EAGER: Deep Causal Representation Learning for Generalizable Visual Understanding
EAGER:用于泛化视觉理解的深度因果表示学习
- 批准号:
2236026 - 财政年份:2022
- 资助金额:
$ 60万 - 项目类别:
Standard Grant
Causal and integrative deep learning for Alzheimer's disease genetics
阿尔茨海默病遗传学的因果和综合深度学习
- 批准号:
10267373 - 财政年份:2021
- 资助金额:
$ 60万 - 项目类别:
Deep learning to enable the genetic analysis of aorta
深度学习可实现主动脉的遗传分析
- 批准号:
10613402 - 财政年份:2021
- 资助金额:
$ 60万 - 项目类别: