Unravel machine learning blackboxes -- A general, effective and performance-guaranteed statistical framework for complex and irregular inference problems in data science

揭开机器学习黑匣子——针对数据科学中复杂和不规则推理问题的通用、有效和性能有保证的统计框架

基本信息

  • 批准号:
    2311064
  • 负责人:
  • 金额:
    $ 30万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2023
  • 资助国家:
    美国
  • 起止时间:
    2023-07-01 至 2026-06-30
  • 项目状态:
    未结题

项目摘要

Despite tremendous growth in data analytics in the recent years, data scientists continue to confront a diverse set of emerging challenges, including the “black-box” problems where machine learning methods might be empirically effective but tend to lack interpretability. These “black-box” problems make it difficult to interpret the machine learning results and undermine the trust of the artificial intelligent outcomes, especially in health care domains. This research project will advance the foundations of interpretable data sciences and will develop new solutions for complex irregular statistical inference problems. The project will expand applications of statistics and uncertainty quantification in machine learning and data sciences. The research results will be integrated into course curricula to train the next generation of statisticians and data scientists. This project will pay a particular attention to advancing broader participation in statistical sciences at all educational levels and the research findings will be disseminated in various interdisciplinary venues to bolster knowledge synthesis among different domains. In more detail, this project will provide novel mathematical and computational developments to tackle irregular inference problems and will unravel the black-boxes in several machine learning models in terms of their interpretability. Here, “irregular inference problems” refers to highly complex problems for which the existing regular statistical inference conditions and large sample theories do not apply. The research agenda will focus specifically on providing valid and performance-guaranteed statistical inference for problems concerning discrete (numerical) or non-numerical parameters, and problems involving non-traditional data (e.g., non-numerical data), tailoring the study to the three popular machine learning models: random forests, deep neural networks, and graphical networks. The research initiative includes four subprojects: (i) uncertainty quantification of the tree learning methods and random forests; (ii) performance-guaranteed architecture discovery of deep neural network models; (iii) statistical inference for generative graphical networks; and (iv) theoretical developments for solving irregular inference problems. The results of the projects are expected to improve interpretability of a broader class of machine learning tools.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
尽管近年来数据分析有了巨大的增长,但数据科学家仍然面临着各种各样的新挑战,包括“黑盒”问题,即机器学习方法可能在经验上有效,但往往缺乏可解释性。这些“黑箱”问题使得解释机器学习结果变得困难,并破坏了对人工智能结果的信任,特别是在医疗保健领域。该研究项目将推进可解释数据科学的基础,并为复杂的不规则统计推断问题开发新的解决方案。该项目将扩大统计和不确定性量化在机器学习和数据科学中的应用。研究成果将纳入课程,以培训下一代统计人员和数据科学家。这一项目将特别重视推动各级教育更广泛地参与统计科学,并将在各种跨学科场所传播研究成果,以促进不同领域的知识综合。更详细地说,该项目将提供新的数学和计算发展来解决不规则推理问题,并将在可解释性方面解开几个机器学习模型中的黑盒。这里,“不规则推理问题”是指现有的规则统计推理条件和大样本理论不适用的高度复杂的问题。研究议程将特别侧重于为离散(数值)或非数值参数问题以及涉及非传统数据的问题(例如,非数值数据),根据三种流行的机器学习模型定制研究:随机森林,深度神经网络和图形网络。该研究计划包括四个子项目:(i)树学习方法和随机森林的不确定性量化;(ii)深度神经网络模型的性能保证架构发现;(iii)生成图形网络的统计推理;以及(iv)解决不规则推理问题的理论发展。该奖项反映了NSF的法定使命,并通过使用基金会的知识价值和更广泛的影响审查标准进行评估,被认为值得支持。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Minge Xie其他文献

Additive effects among uterine paracrine factors in promoting bovine trophoblast cell proliferation
子宫旁分泌因子促进牛滋养层细胞增殖的叠加作用
  • DOI:
  • 发表时间:
    2014
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Minge Xie
  • 通讯作者:
    Minge Xie
Impact of measurement error on container inspection policies at port-of-entry
  • DOI:
    10.1007/s10479-010-0681-6
  • 发表时间:
    2010-01-27
  • 期刊:
  • 影响因子:
    4.500
  • 作者:
    Yada Zhu;Mingyu Li;Christina M. Young;Minge Xie;Elsayed A. Elsayed
  • 通讯作者:
    Elsayed A. Elsayed
Utility of the Activity Measure for Post-Acute Care (AM-PAC) as a Measure of Functional Recovery Across the TBI Rehabilitation Continuum
急性后期照护活动量表(AM - PAC)在创伤性脑损伤康复连续过程中作为功能恢复衡量指标的效用
  • DOI:
    10.1016/j.apmr.2025.01.371
  • 发表时间:
    2025-04-01
  • 期刊:
  • 影响因子:
    3.700
  • 作者:
    Monique Tremaine;Hayk Petrosyan;Minge Xie;Onrina Chandra;Shelby Hinchman
  • 通讯作者:
    Shelby Hinchman

Minge Xie的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Minge Xie', 18)}}的其他基金

ATD: Anomaly Detection with Confidence and Precision
ATD:充满信心且精确的异常检测
  • 批准号:
    2027855
  • 财政年份:
    2020
  • 资助金额:
    $ 30万
  • 项目类别:
    Standard Grant
Repro Sampling Method: A Transformative Artificial-Sample-Based Inferential Framework with Applications to Discrete Parameter, High-Dimensional Data, and Rare Events Inferences
再现采样方法:一种基于人工样本的变革性推理框架,应用于离散参数、高维数据和稀有事件推理
  • 批准号:
    2015373
  • 财政年份:
    2020
  • 资助金额:
    $ 30万
  • 项目类别:
    Standard Grant
Confidence Distribution (CD) and Efficient Approaches for Combining Inferences from Massive Complex Data
置信分布 (CD) 和结合海量复杂数据推论的有效方法
  • 批准号:
    1513483
  • 财政年份:
    2015
  • 资助金额:
    $ 30万
  • 项目类别:
    Standard Grant
Conference on Advanced Statistical Methods for Underground Seismic Event Monitoring and Verification
地下地震事件监测与验证先进统计方法会议
  • 批准号:
    1309312
  • 财政年份:
    2013
  • 资助金额:
    $ 30万
  • 项目类别:
    Standard Grant
New Developments on Confidence Distributions (CDs) and Statistical Inference: Theory, Methodology and Applications
置信分布(CD)和统计推断的新进展:理论、方法和应用
  • 批准号:
    1107012
  • 财政年份:
    2011
  • 资助金额:
    $ 30万
  • 项目类别:
    Continuing Grant
An Effective Methodology for Combining Information from Independent Sources with Applications to Social and Behavioral Sciences and Medical Research
将独立来源的信息与社会和行为科学以及医学研究的应用相结合的有效方法
  • 批准号:
    0851521
  • 财政年份:
    2009
  • 资助金额:
    $ 30万
  • 项目类别:
    Standard Grant
ATD: Statistical Methods for Nuclear Material Surveillance Using Mobile Sensors
ATD:使用移动传感器进行核材料监测的统计方法
  • 批准号:
    0915139
  • 财政年份:
    2009
  • 资助金额:
    $ 30万
  • 项目类别:
    Continuing Grant
New Developments in Longitudinal and Heterogeneous Data Analysis with Applications to the Social and Behavioral Sciences
纵向和异构数据分析的新进展及其在社会和行为科学中的应用
  • 批准号:
    0241859
  • 财政年份:
    2003
  • 资助金额:
    $ 30万
  • 项目类别:
    Standard Grant
Messy Data Modeling and Related Topics
凌乱数据建模及相关主题
  • 批准号:
    9803273
  • 财政年份:
    1998
  • 资助金额:
    $ 30万
  • 项目类别:
    Standard Grant

相似国自然基金

基于深度学习与多源信息融合的TBM掘进岩体识别方法研究
  • 批准号:
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
基于特征工程与深度学习的启闭机品质智能无损检测方法关键技术研究
  • 批准号:
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
机器学习助力高稳定金属锑基电极构筑及其储钠机 制研究
  • 批准号:
    2024JJ5126
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
融合深度特征的多视图多超平面孪生支持向量回归算法研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
基于多任务脑电特征的意识障碍患者预后评估方法研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    15.0 万元
  • 项目类别:
    省市级项目
基 于 八 面 体 特 征 参 数 工 程 与 机 器 学 习 探 索 Ba12B ′Nb9O36 基陶瓷的微波介电性能优化研究
  • 批准号:
    2024JJ6385
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
基于机器学习的神经重症患者撤机决策模型的构建及验证研究
  • 批准号:
    2024JJ7005
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
基于多染色深度学习和多任务双流注意力机 制的直肠癌病理完全缓解预测研究
  • 批准号:
    Q24H160054
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
基于类脑运动学习的序贯式脑机接口研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0 万元
  • 项目类别:
    面上项目
基于混合脑机接口和多模态深度学习技术的步态康复行为识别方法研究
  • 批准号:
    LQ23F030015
  • 批准年份:
    2023
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目

相似海外基金

Machine Learning to Unravel Anti-Ageing Compounds
机器学习揭示抗衰老化合物
  • 批准号:
    BB/V010123/2
  • 财政年份:
    2023
  • 资助金额:
    $ 30万
  • 项目类别:
    Research Grant
Developing Machine Learning Potential to Unravel Quantum Effect on Ionic Hydration and Transport in Nanoscale Confinement
开发机器学习潜力来揭示纳米尺度限制中离子水合和传输的量子效应
  • 批准号:
    2154996
  • 财政年份:
    2022
  • 资助金额:
    $ 30万
  • 项目类别:
    Standard Grant
Machine Learning to Unravel Anti-Ageing Compounds
机器学习揭示抗衰老化合物
  • 批准号:
    BB/V007971/1
  • 财政年份:
    2021
  • 资助金额:
    $ 30万
  • 项目类别:
    Research Grant
Computational approaches to unravel immune receptor sequencing for cancer immunotherapy
揭示癌症免疫治疗免疫受体测序的计算方法
  • 批准号:
    10490312
  • 财政年份:
    2021
  • 资助金额:
    $ 30万
  • 项目类别:
Machine Learning to Unravel Anti-Ageing Compounds
机器学习揭示抗衰老化合物
  • 批准号:
    BB/V010123/1
  • 财政年份:
    2021
  • 资助金额:
    $ 30万
  • 项目类别:
    Research Grant
Computational approaches to unravel immune receptor sequencing for cancer immunotherapy
揭示癌症免疫治疗免疫受体测序的计算方法
  • 批准号:
    10305538
  • 财政年份:
    2021
  • 资助金额:
    $ 30万
  • 项目类别:
Misfoldome-centered multiOMICS approach to unravel preeclampsia subphenotypes
以错误折叠组为中心的多组学方法揭示先兆子痫亚表型
  • 批准号:
    9933617
  • 财政年份:
    2019
  • 资助金额:
    $ 30万
  • 项目类别:
Systems biology frameworks to unravel mechanisms driving complex disorders
系统生物学框架揭示复杂疾病的驱动机制
  • 批准号:
    9888378
  • 财政年份:
    2019
  • 资助金额:
    $ 30万
  • 项目类别:
Misfoldome-centered multiOMICS approach to unravel preeclampsia subphenotypes.
以错误折叠组为中心的多组学方法揭示先兆子痫亚表型。
  • 批准号:
    9269245
  • 财政年份:
    2015
  • 资助金额:
    $ 30万
  • 项目类别:
Misfoldome-centered multiOMICS approach to unravel preeclampsia subphenotypes.
以错误折叠组为中心的多组学方法揭示先兆子痫亚表型。
  • 批准号:
    8947210
  • 财政年份:
    2015
  • 资助金额:
    $ 30万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了