Black-Box Science: Ideas and Insights for Learning-Based Statistical Inference

黑盒科学:基于学习的统计推断的想法和见解

基本信息

  • 批准号:
    2015400
  • 负责人:
  • 金额:
    $ 16万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Continuing Grant
  • 财政年份:
    2020
  • 资助国家:
    美国
  • 起止时间:
    2020-07-01 至 2024-06-30
  • 项目状态:
    已结题

项目摘要

This project seeks to develop essential tools that will allow scientists to better harness the full power of machine learning in practical scientific settings. In the current era of big data, machine learning algorithms have set themselves apart as excellent, accurate tools for modeling complex systems and predicting future outcomes. Determining why those particular algorithms actually work and how those predictions are generated has proven to be a much greater challenge, yet understanding these aspects is crucial for practical scientific use. For example, if an algorithm predicts that you are at risk for a particular disease, you will instinctively care less about the exact percentage chance you have of getting it and much more about why you are more likely to get it and whether there is something you could do to prevent getting it. This work will develop tools that allow scientists to more easily determine which variables most affect an algorithm's performance and whether some other collection of variables might offer an alternative but equally accurate explanation for the outcomes predicted. Various components of these algorithms will also be explored mathematically to determine whether some of them can be borrowed and inserted into simpler models in order to obtain predictions that are not only more accurate, but are also more easily explainable.This project seeks to develop efficient means of statistical inference within a machine learning context with an emphasis on random forests in particular. Specifically, a computationally efficient hypothesis test will be developed that allows for p-values for feature importance to be calculated with similar effort to the original algorithm. In addition to these tests, a framework for characterizing the uncertainty in the model selection process itself will be developed to provide insights into not just the optimal model obtained, but also to illustrate how many alternative models may exist with similar predictive power. Finally, an in-depth study on the fundamental role of randomness in supervised learning ensembles will be undertaken. Lessons learned about the helpful effects of such randomness will be utilized to boost performance of more traditional models in appropriate settings.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
该项目旨在开发必要的工具,使科学家能够在实际的科学环境中更好地利用机器学习的全部力量。在当前的大数据时代,机器学习算法已经成为建模复杂系统和预测未来结果的优秀、准确的工具。事实证明,确定这些特定算法实际上为什么有效以及这些预测是如何产生的是一个更大的挑战,但理解这些方面对于实际的科学应用至关重要。例如,如果一个算法预测你有患某种疾病的风险,你会本能地不太关心你得到它的确切百分比机会,而更关心为什么你更有可能得到它,以及你是否可以采取一些措施来防止得到它。这项工作将开发工具,让科学家更容易确定哪些变量最影响算法的性能以及是否其他一些变量的集合可能为预测的结果提供另一种但同样准确的解释。这些算法的各个组成部分也将在数学上进行探索,以确定其中一些是否可以借用并插入到更简单的模型中,以获得不仅更准确,而且更容易解释的预测。该项目旨在在机器学习背景下开发有效的统计推断方法,特别强调随机森林。具体而言,将开发一种计算效率高的假设检验,该检验允许以与原始算法类似的努力计算特征重要性的p值。除了这些测试之外,还将开发一个用于表征模型选择过程本身的不确定性的框架,不仅可以深入了解所获得的最佳模型,还可以说明可能存在多少具有类似预测能力的替代模型。最后,将深入研究随机性在监督学习集成中的基本作用。关于这种随机性的有益影响的经验教训将被用来提高更传统的模型在适当的设置中的性能。该奖项反映了NSF的法定使命,并被认为是值得通过使用基金会的智力价值和更广泛的影响审查标准进行评估的支持。

项目成果

期刊论文数量(4)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Randomization as Regularization: A Degrees of Freedom Explanation for Random Forest Success
  • DOI:
  • 发表时间:
    2019-11
  • 期刊:
  • 影响因子:
    0
  • 作者:
    L. Mentch;Siyu Zhou
  • 通讯作者:
    L. Mentch;Siyu Zhou
Getting Better from Worse: Augmented Bagging and a Cautionary Tale of Variable Importance
  • DOI:
  • 发表时间:
    2020-03
  • 期刊:
  • 影响因子:
    0
  • 作者:
    L. Mentch;Siyu Zhou
  • 通讯作者:
    L. Mentch;Siyu Zhou
Scalable and Efficient Hypothesis Testing with Random Forests
  • DOI:
  • 发表时间:
    2019-04
  • 期刊:
  • 影响因子:
    0
  • 作者:
    T. Coleman;Wei Peng;L. Mentch
  • 通讯作者:
    T. Coleman;Wei Peng;L. Mentch
Trees, forests, chickens, and eggs: when and why to prune trees in a random forest
树、森林、鸡和蛋:何时以及为何在随机森林中修剪树木
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Lucas Mentch其他文献

An international multi-cohort investigation of self-reported sleep and future depressive symptoms in older adults
一项针对老年人自我报告睡眠和未来抑郁症状的国际多队列研究
  • DOI:
    10.1038/s41598-025-07864-z
  • 发表时间:
    2025-07-04
  • 期刊:
  • 影响因子:
    3.900
  • 作者:
    Meredith L. Wallace;Nina Oryshkewych;Sanne J.W. Hoepel;Daniel J. Buysse;Lucas Mentch;Meryl A. Butters;Katie L. Stone;Kristine Yaffe;Lisa L. Barnes;Andrew S. Lim;Kristine E. Ensrud;Misti L. Paudel;Annemarie Luik
  • 通讯作者:
    Annemarie Luik
mHealth Physical Activity and Patient-Reported Outcomes in Patients with Inflammatory Bowel Diseases: Cluster Analysis (Preprint)
炎症性肠病患者的 mHealth 身体活动和患者报告的结果:聚类分析(预印本)

Lucas Mentch的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Lucas Mentch', 18)}}的其他基金

Collaborative Research: Statistical Inference Using Random Forests and Related Methods
合作研究:使用随机森林和相关方法进行统计推断
  • 批准号:
    1712041
  • 财政年份:
    2017
  • 资助金额:
    $ 16万
  • 项目类别:
    Standard Grant

相似国自然基金

拟南芥F-box E3连接酶SUSC6参与植物免疫调控的分子机制研究
  • 批准号:
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
U-Box型E3泛素连接酶OsPUB57负调控水稻稻瘟病抗性机制研究
  • 批准号:
    2025JJ50110
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
基于Box-Behnken响应面法的全掺磷石膏基层材料优化设计及典型路面结构研究
  • 批准号:
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
U-box E3泛素连接酶GmPUB20A调控大豆对孢囊线虫病的抗性机理研究
  • 批准号:
    32402324
  • 批准年份:
    2024
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
MADS-box基因在沙棘属植物雌维花分化和器官决定中的作用研究
  • 批准号:
    32400190
  • 批准年份:
    2024
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
菊花MADS-box转录因子CmAGL6响应短日照调节花器官发育的机制
  • 批准号:
    32460776
  • 批准年份:
    2024
  • 资助金额:
    33 万元
  • 项目类别:
    地区科学基金项目
赤霉素与B类MADS-box基因互作调控紫花地丁两型花进化发育机制研究
  • 批准号:
    32360059
  • 批准年份:
    2023
  • 资助金额:
    32 万元
  • 项目类别:
    地区科学基金项目
单属种濒危植物蒜头果Ⅱ型MADS-box基因的全基因组表征及在果实发育过程中的功能解析
  • 批准号:
    32360090
  • 批准年份:
    2023
  • 资助金额:
    32 万元
  • 项目类别:
    地区科学基金项目
T-box转录因子在甲状腺发育和先天性甲减发生发展中的功能与机制研究
  • 批准号:
    n/a
  • 批准年份:
    2023
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
DEAD-box蛋白相分离调控细菌冷激应答的机制研究
  • 批准号:
    32301085
  • 批准年份:
    2023
  • 资助金额:
    20 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

MRI: Development of a Scanning Single-Electron Box Electrometer Microscope for Studying Materials for Quantum Science and Technology
MRI:开发用于研究量子科学和技术材料的扫描单电子盒静电计显微镜
  • 批准号:
    2117438
  • 财政年份:
    2021
  • 资助金额:
    $ 16万
  • 项目类别:
    Standard Grant
Illuminating the black box: Using consensus in student survey reports as an indicator of instructional microclimates in mathematics and science
照亮黑匣子:利用学生调查报告中的共识作为数学和科学教学微环境的指标
  • 批准号:
    1544208
  • 财政年份:
    2016
  • 资助金额:
    $ 16万
  • 项目类别:
    Standard Grant
The application of science to everyday life, - development of demonstration equipment to show the relation between Newton's law of inertia and the vaulting tobibako (vaulting box) in gym class-
科学在日常生活中的应用, - 开发演示设备,在体育课上展示牛顿惯性定律和跳马箱之间的关系 -
  • 批准号:
    24650516
  • 财政年份:
    2012
  • 资助金额:
    $ 16万
  • 项目类别:
    Grant-in-Aid for Challenging Exploratory Research
Opening The "Black Box" of Science and Technology Policy Making in China: The Case of Biotechnology
揭开中国科技政策制定的“黑匣子”:以生物技术为例
  • 批准号:
    1115319
  • 财政年份:
    2010
  • 资助金额:
    $ 16万
  • 项目类别:
    Standard Grant
Opening The "Black Box" of Science and Technology Policy Making in China: The Case of Biotechnology
揭开中国科技政策制定的“黑匣子”:以生物技术为例
  • 批准号:
    0925015
  • 财政年份:
    2010
  • 资助金额:
    $ 16万
  • 项目类别:
    Standard Grant
What's in Your Tool Box? Best Practices in R&D Prioritization, Management, and Evaluation: A Science of Science Policy Workshop - October 28-29, 2009 in Washington DC
你的工具箱里有什么?
  • 批准号:
    1004007
  • 财政年份:
    2009
  • 资助金额:
    $ 16万
  • 项目类别:
    Interagency Agreement
Doctoral Dissertation Research in Political Science: The Fifth Source and the Ballot Box: Public Money, Candidate Time and Changing American Elections
政治学博士论文研究:第五来源和投票箱:公共资金、候选人时间和变化的美国选举
  • 批准号:
    0819060
  • 财政年份:
    2008
  • 资助金额:
    $ 16万
  • 项目类别:
    Standard Grant
Looking Inside the Black Box: Classroom Practice that Supports High Achievement in Both Science and Reading: A Planning Grant
探究黑匣子:支持科学和阅读取得高成就的课堂实践:规划补助金
  • 批准号:
    0089222
  • 财政年份:
    2000
  • 资助金额:
    $ 16万
  • 项目类别:
    Standard Grant
Dissertation Research: Behind the Box: Science, Technology, and the Television Industry, 1920-1970
论文研究:盒子背后:科学、技术和电视产业,1920-1970
  • 批准号:
    9711043
  • 财政年份:
    1997
  • 资助金额:
    $ 16万
  • 项目类别:
    Standard Grant
An Electronic Mail-Box and Teleconferencing Network For Theoretical Computer Science
理论计算机科学的电子邮箱和电话会议网络
  • 批准号:
    7801689
  • 财政年份:
    1978
  • 资助金额:
    $ 16万
  • 项目类别:
    Continuing Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了