Interactive Methods for Data-Adaptive Multiple Testing

数据自适应多重测试的交互式方法

基本信息

  • 批准号:
    1916220
  • 负责人:
  • 金额:
    $ 18万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Continuing Grant
  • 财政年份:
    2019
  • 资助国家:
    美国
  • 起止时间:
    2019-09-01 至 2022-08-31
  • 项目状态:
    已结题

项目摘要

In modern applications, very large and complex data sets are routinely collected without a specific research question in mind. Rather, the express goal is to explore the data in search of novel insights, discovering relationships and structure they may not expected to be found, then report inferences for those findings. This project provides a series of iterative algorithmic frameworks for interactive multiple testing, which blend exploratory and confirmatory analyses. The frameworks are adaptive in an unusually strong sense: at each step of the procedure, the algorithm reveals more data to the analyst who makes data-driven decisions that guide the procedure.The starting point of this project is the PI's recent work on the AdaPT and STAR algorithms, which give flexible and powerful frameworks for controlling the FDR while exploiting side information (AdaPT) or enforcing constraints on the rejection set (STAR). Given predictor for each p-value, AdaPT lets analysts interactively estimate Bayes-optimal p-value weights from the data using any machine learning method, while provably controlling finite-sample FDR. The STAR likewise allows for generic interactive modeling while also guaranteeing that the rejection set satisfies natural structural constraints such as hierarchy principles in regression. Both methods guarantee FDR control by means of optional stopping arguments, giving near-total flexibility to the analyst to adaptively model the data. The PI will work on four projects that continue this research program by developing new interactive methods and applying AdaPT to current scientific problems.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
在现代应用程序中,非常大和复杂的数据集被定期收集,而没有考虑到特定的研究问题。相反,明确的目标是探索数据以寻找新的见解,发现它们可能没有被发现的关系和结构,然后报告这些发现的推论。该项目提供了一系列交互式多重测试的迭代算法框架,其中混合了探索性和验证性分析。这些框架在一个非常强烈的意义上是适应性的:在程序的每一步,该算法向分析师展示更多的数据,分析师做出数据驱动的决策来指导程序。该项目的起点是PI最近在AdaPT和星星算法上的工作,它提供了灵活而强大的框架,用于控制FDR,同时利用边信息(AdaPT)或对拒绝集强制约束(星星)。给定每个p值的预测器,AdaPT允许分析师使用任何机器学习方法从数据中交互式估计贝叶斯最优p值权重,同时可证明地控制有限样本FDR。星星同样允许通用的交互式建模,同时也保证拒绝集满足自然的结构约束,如回归中的层次原则。这两种方法都通过可选的停止参数来保证FDR控制,为分析人员提供了几乎完全的灵活性,以自适应地对数据进行建模。PI将致力于四个项目,通过开发新的交互方法和将AdaPT应用于当前的科学问题来继续这一研究计划。该奖项反映了NSF的法定使命,并通过使用基金会的知识价值和更广泛的影响审查标准进行评估,被认为值得支持。

项目成果

期刊论文数量(2)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
STATISTICAL METHODS FOR REPLICABILITY ASSESSMENT
  • DOI:
    10.1214/20-aoas1336
  • 发表时间:
    2020-09-01
  • 期刊:
  • 影响因子:
    1.8
  • 作者:
    Hung, Kenneth;Fithian, William
  • 通讯作者:
    Fithian, William
A general interactive framework for false discovery rate control under structural constraints
  • DOI:
    10.1093/biomet/asaa064
  • 发表时间:
    2021-06-01
  • 期刊:
  • 影响因子:
    2.7
  • 作者:
    Lei, Lihua;Ramdas, Aaditya;Fithian, William
  • 通讯作者:
    Fithian, William
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

William Fithian其他文献

Smoothed Nested Testing on Directed Acyclic Graphs.
有向无环图的平滑嵌套测试。
  • DOI:
    10.1093/biomet/asab041
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    2.7
  • 作者:
    Wesley Tansey;Jackson Loper;Lihua Lei;William Fithian
  • 通讯作者:
    William Fithian
Nonparametric Identifiability in Species Distribution and Abundance Models: Why it Matters and How to Diagnose a Lack of it Using Simulation
物种分布和丰度模型中的非参数可识别性:为什么它很重要以及如何使用模拟来诊断非参数可识别性
Selection Adjusted Confidence Intervals With More Power to Determine the Sign
选择具有更强确定符号能力的调整置信区间
  • DOI:
  • 发表时间:
    2013
  • 期刊:
  • 影响因子:
    0
  • 作者:
    A. Weinstein;William Fithian;Y. Benjamini
  • 通讯作者:
    Y. Benjamini
AdaPT-GMM: Powerful and robust covariate-assisted multiple testing
AdaPT-GMM:强大且稳健的协变量辅助多重检验
  • DOI:
    10.1515/jci-2023-0059
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    1.4
  • 作者:
    Patrick Chao;William Fithian
  • 通讯作者:
    William Fithian
Optimality of the max test for detecting sparse signals with Gaussian or heavier tail
用于检测具有高斯或更重尾部的稀疏信号的最大测试的最优性
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Xiao Li;William Fithian
  • 通讯作者:
    William Fithian

William Fithian的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

相似国自然基金

Computational Methods for Analyzing Toponome Data
  • 批准号:
    60601030
  • 批准年份:
    2006
  • 资助金额:
    17.0 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

CAREER: Next-Generation Methods for Statistical Integration of High-Dimensional Disparate Data Sources
职业:高维不同数据源统计集成的下一代方法
  • 批准号:
    2422478
  • 财政年份:
    2024
  • 资助金额:
    $ 18万
  • 项目类别:
    Continuing Grant
NewDataMetrics: Econometrics for New Data: Theory, Methods, and Applications
NewDataMetrics:新数据的计量经济学:理论、方法和应用
  • 批准号:
    EP/Z000335/1
  • 财政年份:
    2024
  • 资助金额:
    $ 18万
  • 项目类别:
    Research Grant
Modern statistical methods for clustering community ecology data
群落生态数据聚类的现代统计方法
  • 批准号:
    DP240100143
  • 财政年份:
    2024
  • 资助金额:
    $ 18万
  • 项目类别:
    Discovery Projects
CAREER: Machine learning, Mapping Spaces, and Obstruction Theoretic Methods in Topological Data Analysis
职业:拓扑数据分析中的机器学习、映射空间和障碍理论方法
  • 批准号:
    2415445
  • 财政年份:
    2024
  • 资助金额:
    $ 18万
  • 项目类别:
    Continuing Grant
SBIR Phase I: Methods for Embedding User Data into 3D Generative AI Computer-aided-Design Models
SBIR 第一阶段:将用户数据嵌入 3D 生成式 AI 计算机辅助设计模型的方法
  • 批准号:
    2335491
  • 财政年份:
    2024
  • 资助金额:
    $ 18万
  • 项目类别:
    Standard Grant
Efficient and effective methods for classifying massive time series data
海量时间序列数据高效有效的分类方法
  • 批准号:
    DP240100048
  • 财政年份:
    2024
  • 资助金额:
    $ 18万
  • 项目类别:
    Discovery Projects
Critical Data Science Methods to Broaden Capacity in STEM Education Research
扩大 STEM 教育研究能力的关键数据科学方法
  • 批准号:
    2321179
  • 财政年份:
    2024
  • 资助金额:
    $ 18万
  • 项目类别:
    Standard Grant
Developing statistical methods for structural change analysis using panel data
使用面板数据开发结构变化分析的统计方法
  • 批准号:
    24K16343
  • 财政年份:
    2024
  • 资助金额:
    $ 18万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
Biodiversity and the Evolving Earth: New Data, New Methods, New Insights
生物多样性和不断演变的地球:新数据、新方法、新见解
  • 批准号:
    2889701
  • 财政年份:
    2023
  • 资助金额:
    $ 18万
  • 项目类别:
    Studentship
Developing methods for Big Data capture in support of the Digital Twin for Investment Casting Shelling
开发大数据捕获方法以支持熔模铸造脱壳的数字孪生
  • 批准号:
    2889986
  • 财政年份:
    2023
  • 资助金额:
    $ 18万
  • 项目类别:
    Studentship
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了