Collaborative Research: III: Medium: Towards Effective Detection and Mitigation for Shortcut Learning: A Data Modeling Framework
协作研究:III:媒介:针对捷径学习的有效检测和缓解:数据建模框架
基本信息
- 批准号:2310260
- 负责人:
- 金额:$ 60万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2023
- 资助国家:美国
- 起止时间:2023-10-01 至 2027-09-30
- 项目状态:未结题
- 来源:
- 关键词:
项目摘要
Deep Neural Network (DNN) generalization is a challenging problem. Many DNNs do not remain predictive when the distribution of data changes or there are small disturbances to their input. A common reason for this behavior is “shortcut learning”, in which the DNN learns to make decisions based on relationships observed in the data, but that are not causal. These decisions fail when the model is transferred to real-world scenarios because the network has latched onto spurious correlations. This project investigates how to identify and mitigate shortcut learning in DNNs. A successful outcome of this research will lead to advances in theoretical understanding, as well as robust and generalizable DNN algorithms that avoid shortcuts. The education program integrates machine learning, industrial engineering, and health informatics to train students with essential data analytics tools in information systems, as well as to attract, mentor and retain members from underrepresented groups.The primary goal of this project is to systematically investigate the identification and mitigation of shortcut features from a data-centric perspective to facilitate generalization in deep learning. The developed data-centric mechanisms could be directly adopted in real-world data analytics systems to mitigate the drawbacks of shortcut learning. The project studies shortcut identification and detection at different levels, including instance, feature, and task levels, and then performs shortcut mitigation through data augmentation and training regularization. The project also demonstrates how the proposed research innovations could be embedded into two real DNN-based medical informatics systems. The proposed framework uncovers intrinsic properties of shortcut learning by calibrating shortcut features across different types of distribution shifts, and should support both researchers and practitioners.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
深神经网络(DNN)概括是一个挑战问题。当数据变化的分布或输入的小灾难时,许多DNN不会保持预测。这种行为的一个普遍原因是“快捷学习”,其中DNN学会根据数据中观察到的关系做出决定,但不是因果关系。当该模型转移到现实世界情景时,这些决定失败了,因为网络已锁定在虚假相关性上。该项目研究了如何识别和减轻DNN中的快捷方式学习。这项研究的成功结果将导致理论理解的进步,以及避免捷径的鲁棒和可推广的DNN算法。该教育计划将机器学习,工业工程和健康信息纳入了信息系统中的基本数据分析工具,并吸引,精神和保留成员来自代表性不足的群体的成员。该项目的主要目标是系统地研究和减轻捷径识别和减轻捷径特征,从数据量表的角度来促进一般学习的一般学习。可以在现实世界数据分析系统中直接采用开发的以数据为中心的机制来减轻快捷方式学习的缺点。该项目研究在不同级别的捷径识别和检测,包括实例,功能和任务级别,然后通过受到数据增强和培训的调节来进行快捷措施缓解。该项目还展示了如何将拟议的研究创新嵌入两个基于DNN的实际医学信息系统中。拟议的框架通过校准不同类型的分配转移的快捷方式来揭示快捷方式学习的内在属性,并应支持研究人员和实践者。该奖项反映了NSF的法定任务,并被认为是值得通过基金会的知识分子优点和更广泛的审查标准来通过评估来通过评估来支持的。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Xia Hu其他文献
Effects of nutrient input on soil nitrogen cycle in winter in the Alpine Zone
高寒地区冬季养分输入对土壤氮循环的影响
- DOI:
10.1166/jbmb.2018.1748 - 发表时间:
2018 - 期刊:
- 影响因子:0.5
- 作者:
Xia Hu;Geng Sun;Peng Yin;Mingfu Gong - 通讯作者:
Mingfu Gong
Differentially Private Counterfactuals via Functional Mechanism
通过功能机制实现差分隐私反事实
- DOI:
10.48550/arxiv.2208.02878 - 发表时间:
2022 - 期刊:
- 影响因子:0
- 作者:
Fan Yang;Qizhang Feng;Kaixiong Zhou;Jiahao Chen;Xia Hu - 通讯作者:
Xia Hu
Electrochemical Aptasensor for Label-Free Detection of Protein Based on Gold Nanoparticle Involved Self-Assembly
基于金纳米粒子自组装的电化学适体传感器用于无标记检测蛋白质
- DOI:
10.4028/www.scientific.net/amm.310.177 - 发表时间:
2013 - 期刊:
- 影响因子:0
- 作者:
Songbai Zhang;Bing Zhang;Qian Liu;Xia Hu;Liying Zheng;Xue‐Wen Liu;J. Lu;Hui Zhou;Shi - 通讯作者:
Shi
Measuring sentence similarity from different aspects
从不同方面衡量句子相似度
- DOI:
10.1109/icmlc.2009.5212182 - 发表时间:
2009 - 期刊:
- 影响因子:0
- 作者:
Lin Li;Xia Hu;Biyun Hu;Jun Wang;Yiming Zhou - 通讯作者:
Yiming Zhou
Learning to recommend questions based on public interest
学会根据公众兴趣推荐问题
- DOI:
10.1145/2063576.2063882 - 发表时间:
2011 - 期刊:
- 影响因子:0
- 作者:
Jun Wang;Xia Hu;Zhoujun Li;Wen;Biyun Hu - 通讯作者:
Biyun Hu
Xia Hu的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Xia Hu', 18)}}的其他基金
CAREER: Human-Centric Big Network Embedding
职业:以人为本的大网络嵌入
- 批准号:
2224843 - 财政年份:2021
- 资助金额:
$ 60万 - 项目类别:
Continuing Grant
CAREER: Human-Centric Big Network Embedding
职业:以人为本的大网络嵌入
- 批准号:
1750074 - 财政年份:2018
- 资助金额:
$ 60万 - 项目类别:
Continuing Grant
III: Small: Collaborative Research: A General Feature Learning Framework for Dynamic Attributed Networks
III:小:协作研究:动态属性网络的通用特征学习框架
- 批准号:
1718840 - 财政年份:2017
- 资助金额:
$ 60万 - 项目类别:
Standard Grant
CRII: III: Novel Embedding Algorithms for Large-Scale and Complex Attributed Networks
CRII:III:大规模和复杂属性网络的新颖嵌入算法
- 批准号:
1657196 - 财政年份:2017
- 资助金额:
$ 60万 - 项目类别:
Standard Grant
相似国自然基金
III-E型CRISPR-Cas系统的结构生物学及其应用研究
- 批准号:32371276
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
乙肝肝纤维化进程咪唑丙酸通过mTORC1通路调控III型固有淋巴细胞糖脂代谢重编程及机制研究
- 批准号:82370622
- 批准年份:2023
- 资助金额:49 万元
- 项目类别:面上项目
铁载体与Fe(III)相互作用过程的铁同位素分馏及机理的模拟实验研究
- 批准号:42377264
- 批准年份:2023
- 资助金额:49 万元
- 项目类别:面上项目
基于III-V族半导体纳米结构阵列的短波红外偏振探测理论与方法研究
- 批准号:62305023
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
高性能TM(I)-Ln(III)单分子磁体的可控合成与构效关系研究
- 批准号:22371031
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
相似海外基金
Collaborative Research: Conference: DESC: Type III: Eco Edge - Advancing Sustainable Machine Learning at the Edge
协作研究:会议:DESC:类型 III:生态边缘 - 推进边缘的可持续机器学习
- 批准号:
2342498 - 财政年份:2024
- 资助金额:
$ 60万 - 项目类别:
Standard Grant
Collaborative Research: Conference: DESC: Type III: Eco Edge - Advancing Sustainable Machine Learning at the Edge
协作研究:会议:DESC:类型 III:生态边缘 - 推进边缘的可持续机器学习
- 批准号:
2342497 - 财政年份:2024
- 资助金额:
$ 60万 - 项目类别:
Standard Grant
III : Medium: Collaborative Research: From Open Data to Open Data Curation
III:媒介:协作研究:从开放数据到开放数据管理
- 批准号:
2420691 - 财政年份:2024
- 资助金额:
$ 60万 - 项目类别:
Standard Grant
Collaborative Research: III: Small: High-Performance Scheduling for Modern Database Systems
协作研究:III:小型:现代数据库系统的高性能调度
- 批准号:
2322973 - 财政年份:2024
- 资助金额:
$ 60万 - 项目类别:
Standard Grant
Collaborative Research: III: Small: High-Performance Scheduling for Modern Database Systems
协作研究:III:小型:现代数据库系统的高性能调度
- 批准号:
2322974 - 财政年份:2024
- 资助金额:
$ 60万 - 项目类别:
Standard Grant