Collaborative Research: III: Medium: Towards Effective Detection and Mitigation for Shortcut Learning: A Data Modeling Framework
协作研究:III:媒介:针对捷径学习的有效检测和缓解:数据建模框架
基本信息
- 批准号:2310261
- 负责人:
- 金额:$ 40万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2023
- 资助国家:美国
- 起止时间:2023-10-01 至 2027-09-30
- 项目状态:未结题
- 来源:
- 关键词:
项目摘要
Generalization of Deep Neural Networks (DNNs) has become a challenging problem. Many DNNs do not remain predictive when the distribution of data changes or there are small disturbances in the input. A major reason for this challenge is shortcut learning, which refer to decisions based on relationships in the data that exist, but which are not causal. These decisions fail when the model is transferred to real-world scenarios because of spurious correlations. This project is to investigate shortcut identification and mitigation in deep learning. The successful outcome of this research will lead to advances in providing theoretical understandings, and developing robust and generalizable DNN algorithms to analyze datasets with various types of shortcuts. The education program that integrates machine learning, industrial engineering, and health informatics is to train students with essential data analytics tools in information systems, to attract, mentor and retain members from underrepresented groups.The primary goal of this project is to systematically investigate the identification and mitigation of shortcut features from a data-centric perspective to facilitate the generalization of deep learning. The developed data-centric mechanisms could be directly adopted in real-world data analytics systems. Specifically, this project studies shortcut identification and detection at different levels, including instance-, feature-, and task-levels, and then performs shortcut mitigation through data augmentation and training regularization. This project also demonstrates how the proposed research innovations could be embedded in two DNN based real medical informatics systems. The proposed frameworks uncover the intrinsic properties of shortcut learning by calibrating shortcut features from different categories of distribution shift, and enable their comprehension and adoption for researchers and practitioners.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
深度神经网络(DNN)的泛化已经成为一个具有挑战性的问题。当数据分布发生变化或输入中存在小干扰时,许多DNN无法保持预测性。这一挑战的一个主要原因是捷径学习,即根据现有数据中的关系做出决定,但这些关系不是因果关系。由于虚假的相关性,当模型被转移到现实世界的场景中时,这些决策就会失败。该项目旨在研究深度学习中的捷径识别和缓解。这项研究的成功结果将导致在提供理论理解方面取得进展,并开发强大且可推广的DNN算法来分析具有各种类型快捷方式的数据集。该教育项目整合了机器学习、工业工程和健康信息学,旨在培养学生掌握信息系统中的基本数据分析工具,以吸引、指导和留住来自代表性不足群体的成员。该项目的主要目标是从以数据为中心的角度系统地研究识别和缓解捷径特征,以促进深度学习的推广。开发的以数据为中心的机制可以直接应用于现实世界的数据分析系统。具体而言,该项目研究了不同级别的快捷方式识别和检测,包括实例,特征和任务级别,然后通过数据增强和训练正则化来执行快捷方式缓解。该项目还展示了如何将拟议的研究创新嵌入到两个基于DNN的真实的医疗信息系统中。建议的框架揭示了捷径学习的内在属性,通过校准不同类别的分布变化的捷径功能,并使他们的理解和采用的研究人员和practitioners.This奖项反映了NSF的法定使命,并已被认为是值得通过使用基金会的智力价值和更广泛的影响审查标准进行评估的支持。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Mengnan Du其他文献
Aligning large language models and geometric deep models for protein representation
将大型语言模型和几何深度学习模型用于蛋白质表征的整合(或对齐,需根据具体语境确定更准确的意思)
- DOI:
10.1016/j.patter.2025.101227 - 发表时间:
2025-05-09 - 期刊:
- 影响因子:7.400
- 作者:
Dong Shu;Bingbing Duan;Kai Guo;Kaixiong Zhou;Jiliang Tang;Mengnan Du - 通讯作者:
Mengnan Du
Learning Disentangled Representations for Time Series
学习时间序列的解缠结表示
- DOI:
- 发表时间:
2021 - 期刊:
- 影响因子:0
- 作者:
Yuening Li;Zhengzhang Chen;D. Zha;Mengnan Du;Denghui Zhang;Haifeng Chen;Xia Hu - 通讯作者:
Xia Hu
What if LLMs Have Different World Views: Simulating Alien Civilizations with LLM-based Agents
如果法学硕士有不同的世界观怎么办:使用基于法学硕士的代理模拟外星文明
- DOI:
10.48550/arxiv.2402.13184 - 发表时间:
2024 - 期刊:
- 影响因子:0
- 作者:
Mingyu Jin;Beichen Wang;Zhaoqian Xue;Suiyuan Zhu;Wenyue Hua;Hua Tang;Kai Mei;Mengnan Du;Yongfeng Zhang - 通讯作者:
Yongfeng Zhang
Using Deep Neural Network to Identify Cancer Survivors Living with Post-Traumatic Stress Disorder on Social Media
使用深度神经网络识别社交媒体上患有创伤后应激障碍的癌症幸存者
- DOI:
- 发表时间:
2019 - 期刊:
- 影响因子:0
- 作者:
Nur Hafieza Ismail;Ninghao Liu;Mengnan Du;Zhe He;Xia Hu - 通讯作者:
Xia Hu
Social Media and Psychological Disorder
社交媒体和心理障碍
- DOI:
- 发表时间:
2019 - 期刊:
- 影响因子:0
- 作者:
Nur Hafieza Ismail;Mengnan Du;Xia Hu - 通讯作者:
Xia Hu
Mengnan Du的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
相似国自然基金
Research on Quantum Field Theory without a Lagrangian Description
- 批准号:24ZR1403900
- 批准年份:2024
- 资助金额:0.0 万元
- 项目类别:省市级项目
Cell Research
- 批准号:31224802
- 批准年份:2012
- 资助金额:24.0 万元
- 项目类别:专项基金项目
Cell Research
- 批准号:31024804
- 批准年份:2010
- 资助金额:24.0 万元
- 项目类别:专项基金项目
Cell Research (细胞研究)
- 批准号:30824808
- 批准年份:2008
- 资助金额:24.0 万元
- 项目类别:专项基金项目
Research on the Rapid Growth Mechanism of KDP Crystal
- 批准号:10774081
- 批准年份:2007
- 资助金额:45.0 万元
- 项目类别:面上项目
相似海外基金
Collaborative Research: Conference: DESC: Type III: Eco Edge - Advancing Sustainable Machine Learning at the Edge
协作研究:会议:DESC:类型 III:生态边缘 - 推进边缘的可持续机器学习
- 批准号:
2342498 - 财政年份:2024
- 资助金额:
$ 40万 - 项目类别:
Standard Grant
Collaborative Research: Conference: DESC: Type III: Eco Edge - Advancing Sustainable Machine Learning at the Edge
协作研究:会议:DESC:类型 III:生态边缘 - 推进边缘的可持续机器学习
- 批准号:
2342497 - 财政年份:2024
- 资助金额:
$ 40万 - 项目类别:
Standard Grant
III : Medium: Collaborative Research: From Open Data to Open Data Curation
III:媒介:协作研究:从开放数据到开放数据管理
- 批准号:
2420691 - 财政年份:2024
- 资助金额:
$ 40万 - 项目类别:
Standard Grant
Collaborative Research: III: Small: High-Performance Scheduling for Modern Database Systems
协作研究:III:小型:现代数据库系统的高性能调度
- 批准号:
2322973 - 财政年份:2024
- 资助金额:
$ 40万 - 项目类别:
Standard Grant
Collaborative Research: III: Small: High-Performance Scheduling for Modern Database Systems
协作研究:III:小型:现代数据库系统的高性能调度
- 批准号:
2322974 - 财政年份:2024
- 资助金额:
$ 40万 - 项目类别:
Standard Grant
Collaborative Research: III: Small: A DREAM Proactive Conversational System
合作研究:III:小型:一个梦想的主动对话系统
- 批准号:
2336769 - 财政年份:2024
- 资助金额:
$ 40万 - 项目类别:
Standard Grant
Collaborative Research: III: Small: A DREAM Proactive Conversational System
合作研究:III:小型:一个梦想的主动对话系统
- 批准号:
2336768 - 财政年份:2024
- 资助金额:
$ 40万 - 项目类别:
Standard Grant
Collaborative Research: III: Medium: Designing AI Systems with Steerable Long-Term Dynamics
合作研究:III:中:设计具有可操纵长期动态的人工智能系统
- 批准号:
2312865 - 财政年份:2023
- 资助金额:
$ 40万 - 项目类别:
Standard Grant
Collaborative Research: III: MEDIUM: Responsible Design and Validation of Algorithmic Rankers
合作研究:III:媒介:算法排序器的负责任设计和验证
- 批准号:
2312932 - 财政年份:2023
- 资助金额:
$ 40万 - 项目类别:
Standard Grant
Collaborative Research: III: Small: Reconstruction of Diffusion History in Cyber and Human Networks with Applications in Epidemiology and Cybersecurity
合作研究:III:小:重建网络和人类网络中的扩散历史及其在流行病学和网络安全中的应用
- 批准号:
2324770 - 财政年份:2023
- 资助金额:
$ 40万 - 项目类别:
Standard Grant