Collaborative Research: III: Medium: Towards Effective Detection and Mitigation for Shortcut Learning: A Data Modeling Framework
协作研究:III:媒介:针对捷径学习的有效检测和缓解:数据建模框架
基本信息
- 批准号:2310262
- 负责人:
- 金额:$ 20万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2023
- 资助国家:美国
- 起止时间:2023-10-01 至 2027-09-30
- 项目状态:未结题
- 来源:
- 关键词:
项目摘要
Generalization of Deep Neural Networks (DNNs) has become a challenging problem. Many DNNs do not remain predictive when the distribution of data changes or there are small disturbances in the input. A major reason for this challenge is shortcut learning, which refer to decisions based on relationships in the data that exist, but which are not causal. These decisions fail when the model is transferred to real-world scenarios because of spurious correlations. This project is to investigate shortcut identification and mitigation in deep learning. The successful outcome of this research will lead to advances in providing theoretical understandings, and developing robust and generalizable DNN algorithms to analyze datasets with various types of shortcuts. The education program that integrates machine learning, industrial engineering, and health informatics is to train students with essential data analytics tools in information systems, to attract, mentor and retain members from underrepresented groups.The primary goal of this project is to systematically investigate the identification and mitigation of shortcut features from a data-centric perspective to facilitate the generalization of deep learning. The developed data-centric mechanisms could be directly adopted in real-world data analytics systems. Specifically, this project studies shortcut identification and detection at different levels, including instance-, feature-, and task-levels, and then performs shortcut mitigation through data augmentation and training regularization. This project also demonstrates how the proposed research innovations could be embedded in two DNN based real medical informatics systems. The proposed frameworks uncover the intrinsic properties of shortcut learning by calibrating shortcut features from different categories of distribution shift, and enable their comprehension and adoption for researchers and practitioners.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
深度神经网络(DNN)的泛化已成为一个具有挑战性的问题。当数据分布发生变化或输入存在微小干扰时,许多 DNN 就无法保持预测性。这一挑战的一个主要原因是捷径学习,它是指基于数据中存在的关系做出的决策,但这些关系不是因果关系。当模型转移到现实场景时,由于虚假相关性,这些决策会失败。该项目旨在研究深度学习中的捷径识别和缓解。这项研究的成功成果将在提供理论理解和开发强大且可推广的 DNN 算法来分析具有各种类型的快捷方式的数据集方面取得进展。该教育项目融合了机器学习、工业工程和健康信息学,旨在培训学生掌握信息系统中必要的数据分析工具,以吸引、指导和留住弱势群体的成员。该项目的主要目标是以数据为中心的角度系统地研究快捷特征的识别和缓解,以促进深度学习的泛化。开发的以数据为中心的机制可以直接应用于现实世界的数据分析系统。具体来说,该项目研究不同级别(包括实例级别、特征级别和任务级别)的快捷方式识别和检测,然后通过数据增强和训练正则化来执行快捷方式缓解。该项目还展示了如何将所提出的研究创新嵌入到两个基于 DNN 的真实医学信息系统中。所提出的框架通过校准不同类别的分布变化的快捷特征来揭示快捷学习的内在属性,并使研究人员和从业者能够理解和采用它们。该奖项反映了 NSF 的法定使命,并通过使用基金会的智力价值和更广泛的影响审查标准进行评估,被认为值得支持。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Na Zou其他文献
PolyJet 3D Printing: Predicting Color by Multilayer Perceptron Neural Network
PolyJet 3D 打印:通过多层感知器神经网络预测颜色
- DOI:
10.1016/j.stlm.2022.100049 - 发表时间:
2022 - 期刊:
- 影响因子:0
- 作者:
Xingjian Wei;Na Zou;Li Zeng;Zhijian Pei - 通讯作者:
Zhijian Pei
Distilling the knowledge from large-language model for health event prediction
- DOI:
10.1038/s41598-024-75331-2 - 发表时间:
2024-12-28 - 期刊:
- 影响因子:3.900
- 作者:
Sirui Ding;Jiancheng Ye;Xia Hu;Na Zou - 通讯作者:
Na Zou
Selectivity optimization of real-time and continuous sensing of endogenous H2S in biological fluids
- DOI:
10.1007/s00604-025-07298-4 - 发表时间:
2025-06-23 - 期刊:
- 影响因子:5.300
- 作者:
Na Zou;Xin Li;Meiling Xu;Zhaoxia Wang;Junhua Zhang;Xueliang Wang - 通讯作者:
Xueliang Wang
Identification of the hybrids between Lilium brownii and L. davidii using fluorescence in situ hybridization (FISH)
使用荧光原位杂交 (FISH) 鉴定布朗百合和戴维百合之间的杂交种
- DOI:
10.17660/actahortic.2019.1237.13 - 发表时间:
2019-04 - 期刊:
- 影响因子:0
- 作者:
Like Wu;Wei Zheng;Kongzhong Xiao;Jie Zeng;Luomin Cui;Hui Li;Yanmei Liu;Na Zou;Junhuo Cai;Shujun Zhou - 通讯作者:
Shujun Zhou
Towards Assumption-free Bias Mitigation
迈向无假设偏见缓解
- DOI:
- 发表时间:
2023 - 期刊:
- 影响因子:0
- 作者:
Chia;Yu;Kwei;Xiaotian Han;Xia Hu;Na Zou - 通讯作者:
Na Zou
Na Zou的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Na Zou', 18)}}的其他基金
CAREER: Exploring and Exploiting Data-Centric Modeling for Fairness in Machine Learning
职业:探索和利用以数据为中心的建模以实现机器学习的公平性
- 批准号:
2239257 - 财政年份:2023
- 资助金额:
$ 20万 - 项目类别:
Continuing Grant
III: Medium: Collaborative Research: Towards Effective Interpretation of Deep Learning: Prediction, Representation, Modeling and Utilization
III:媒介:协作研究:走向深度学习的有效解释:预测、表示、建模和利用
- 批准号:
1900990 - 财政年份:2019
- 资助金额:
$ 20万 - 项目类别:
Continuing Grant
相似国自然基金
Research on Quantum Field Theory without a Lagrangian Description
- 批准号:24ZR1403900
- 批准年份:2024
- 资助金额:0.0 万元
- 项目类别:省市级项目
Cell Research
- 批准号:31224802
- 批准年份:2012
- 资助金额:24.0 万元
- 项目类别:专项基金项目
Cell Research
- 批准号:31024804
- 批准年份:2010
- 资助金额:24.0 万元
- 项目类别:专项基金项目
Cell Research (细胞研究)
- 批准号:30824808
- 批准年份:2008
- 资助金额:24.0 万元
- 项目类别:专项基金项目
Research on the Rapid Growth Mechanism of KDP Crystal
- 批准号:10774081
- 批准年份:2007
- 资助金额:45.0 万元
- 项目类别:面上项目
相似海外基金
Collaborative Research: Conference: DESC: Type III: Eco Edge - Advancing Sustainable Machine Learning at the Edge
协作研究:会议:DESC:类型 III:生态边缘 - 推进边缘的可持续机器学习
- 批准号:
2342498 - 财政年份:2024
- 资助金额:
$ 20万 - 项目类别:
Standard Grant
Collaborative Research: III: Small: High-Performance Scheduling for Modern Database Systems
协作研究:III:小型:现代数据库系统的高性能调度
- 批准号:
2322973 - 财政年份:2024
- 资助金额:
$ 20万 - 项目类别:
Standard Grant
Collaborative Research: III: Small: High-Performance Scheduling for Modern Database Systems
协作研究:III:小型:现代数据库系统的高性能调度
- 批准号:
2322974 - 财政年份:2024
- 资助金额:
$ 20万 - 项目类别:
Standard Grant
Collaborative Research: Conference: DESC: Type III: Eco Edge - Advancing Sustainable Machine Learning at the Edge
协作研究:会议:DESC:类型 III:生态边缘 - 推进边缘的可持续机器学习
- 批准号:
2342497 - 财政年份:2024
- 资助金额:
$ 20万 - 项目类别:
Standard Grant
III : Medium: Collaborative Research: From Open Data to Open Data Curation
III:媒介:协作研究:从开放数据到开放数据管理
- 批准号:
2420691 - 财政年份:2024
- 资助金额:
$ 20万 - 项目类别:
Standard Grant
Collaborative Research: III: Small: A DREAM Proactive Conversational System
合作研究:III:小型:一个梦想的主动对话系统
- 批准号:
2336769 - 财政年份:2024
- 资助金额:
$ 20万 - 项目类别:
Standard Grant
Collaborative Research: III: Small: A DREAM Proactive Conversational System
合作研究:III:小型:一个梦想的主动对话系统
- 批准号:
2336768 - 财政年份:2024
- 资助金额:
$ 20万 - 项目类别:
Standard Grant
Collaborative Research: III: Medium: Designing AI Systems with Steerable Long-Term Dynamics
合作研究:III:中:设计具有可操纵长期动态的人工智能系统
- 批准号:
2312865 - 财政年份:2023
- 资助金额:
$ 20万 - 项目类别:
Standard Grant
Collaborative Research: III: MEDIUM: Responsible Design and Validation of Algorithmic Rankers
合作研究:III:媒介:算法排序器的负责任设计和验证
- 批准号:
2312932 - 财政年份:2023
- 资助金额:
$ 20万 - 项目类别:
Standard Grant
Collaborative Research: III: Medium: Algorithms for scalable inference and phylodynamic analysis of tumor haplotypes using low-coverage single cell sequencing data
合作研究:III:中:使用低覆盖率单细胞测序数据对肿瘤单倍型进行可扩展推理和系统动力学分析的算法
- 批准号:
2415562 - 财政年份:2023
- 资助金额:
$ 20万 - 项目类别:
Standard Grant














{{item.name}}会员




