CDS&E-MSS: Data thinning: methods, theory, and applications

CDS

基本信息

  • 批准号:
    2322920
  • 负责人:
  • 金额:
    $ 25万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2023
  • 资助国家:
    美国
  • 起止时间:
    2023-09-15 至 2026-08-31
  • 项目状态:
    未结题

项目摘要

In recent years, there has been an explosion of data across virtually all areas of science and engineering. This has been paired with an increase in the availability and complexity of statistical and machine-learning methods to analyze these data. However, a major challenge arises in validating the resulting models, i.e. in making sure that they capture signal rather than noise. In this project, the project will develop a new framework to split up a dataset into two separate parts, so that one part can be used to fit a complex model, and the remaining part can be used to validate it. Graduate students will be involved in this project, and the PI will carry out efforts to diversify the workforce in statistics. This project explores “data thinning,” a new idea for splitting a dataset arising from a convolution-closed distribution into two or more independent components that sum to yield the original dataset. The PI will generalize the data thinning framework beyond convolution-closed distributions to a much broader class of distributions, by allowing for a dataset to be thinned into two or more independent components that can be re-combined to yield the original dataset via a function other than addition, using principles of sufficiency. Once two or more independent components have been obtained, a model can be fit to one component and validated on the other(s). Connections to sample splitting, data fission, and other related proposals will also be explored. The PI will also collaborate with biomedical researchers to tailor this framework to data from diverse domain areas and will release high-quality software. Ultimately, the data thinning framework will enable rigorous validation and inference after model fitting for a host of problems in science and engineering. Broader impacts include the involvement of graduate students in this research, as well as ongoing diversity and inclusion efforts by the PI.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
近年来,几乎所有科学和工程领域的数据都呈爆炸式增长。与此同时,用于分析这些数据的统计和机器学习方法的可用性和复杂性也在增加。然而,在验证结果模型方面出现了一个重大挑战,即确保它们捕获的是信号而不是噪声。在这个项目中,该项目将开发一个新的框架,将一个数据集分成两个独立的部分,以便一个部分可以用于适应复杂的模型,其余部分可以用于验证它。研究生将参与这一项目,国际统计研究所将努力使统计工作人员多样化。这个项目探索“数据稀疏”,这是一种新的想法,将来自卷积闭合分布的数据集拆分成两个或更多独立的分量,这些分量相加得到原始数据集。PI将数据细化框架从卷积闭合分布推广到更广泛的分布类别,允许将数据集细化为两个或更多独立分量,这些分量可以使用充分性原则通过加法以外的函数重新组合以产生原始数据集。一旦获得了两个或多个独立的组件,模型就可以适合一个组件并在另一个组件上进行验证(S)。还将探讨与样本分离、数据裂变和其他相关提议的联系。PI还将与生物医学研究人员合作,根据不同领域的数据定制这一框架,并将发布高质量的软件。最终,数据细化框架将在对科学和工程中的一系列问题进行模型拟合后,实现严格的验证和推理。更广泛的影响包括研究生参与这项研究,以及PI正在进行的多样性和包容性努力。该奖项反映了NSF的法定使命,并通过使用基金会的智力优势和更广泛的影响审查标准进行评估,被认为值得支持。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Daniela Witten其他文献

Inference on the proportion of variance explained in principal component analysis
主成分分析解释方差比例的推断
  • DOI:
  • 发表时间:
    2024
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Ronan Perry;Snigdha Panigrahi;Jacob Bien;Daniela Witten
  • 通讯作者:
    Daniela Witten

Daniela Witten的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Daniela Witten', 18)}}的其他基金

CAREER: Flexible Network Estimation from High-Dimensional Data
职业:根据高维数据进行灵活的网络估计
  • 批准号:
    1252624
  • 财政年份:
    2013
  • 资助金额:
    $ 25万
  • 项目类别:
    Continuing Grant

相似国自然基金

靶向Pin1改善MSS型结直肠癌免疫抑制微环境的分子机制研究
  • 批准号:
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
鼠李糖乳杆菌通过诱导巨噬细胞M1极化改善MSS型结直肠癌免疫应答的机制研究
  • 批准号:
    QN25H160091
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
电针激活β-arrestin 1/IFN通路促进“冷-热”免疫表型转化协同IDO抑制剂治疗MSS肠癌的机制研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0 万元
  • 项目类别:
    青年科学基金项目
千金藤素通过自噬损伤导致的免疫原性细胞死亡促进 anti-PD1 治疗MSS 型结直肠癌的疗效与机制研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
基于糖醛酸离子交联的枸杞多糖凝胶用于口服结肠靶向递药抗 MSS 型结肠癌研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
调控pMMR/MSS型直肠癌放疗联合ICIs治疗响应差异的免疫微环境机制研究
  • 批准号:
    2024Y9290
  • 批准年份:
    2024
  • 资助金额:
    30.0 万元
  • 项目类别:
    省市级项目
AIM2 炎症小体调控 T 细胞功能及互作在促进 MSS 型直肠癌放疗联合 PD-1 抑 制剂治疗敏感性中的作用及机制研究
  • 批准号:
    24ZR1413300
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
MSS型结直肠癌通过抑制GSDMB依赖的细胞焦亡介导免疫治疗耐受的机制研究
  • 批准号:
    2024Y9636
  • 批准年份:
    2024
  • 资助金额:
    15.0 万元
  • 项目类别:
    省市级项目
电针激活β-arrestin 1/IFN通路促进"冷-热"免疫表型转化协同IDO抑制剂治疗MSS肠癌的机制研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Collaborative Research: CDS&E-MSS: Community detection via covariance structures
合作研究:CDS
  • 批准号:
    2245380
  • 财政年份:
    2023
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
CDS&E-MSS: Sparsely Activated Bayesian Neural Networks from Deep Gaussian Processes
CDS
  • 批准号:
    2312173
  • 财政年份:
    2023
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
CDS&E-MSS: Causal Induction in Sequential Decision Processes
CDS
  • 批准号:
    2305631
  • 财政年份:
    2023
  • 资助金额:
    $ 25万
  • 项目类别:
    Continuing Grant
Collaborative Research: CDS&E-MSS: Community detection via covariance structures
合作研究:CDS
  • 批准号:
    2245381
  • 财政年份:
    2023
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
CDS&E-MSS: Topological Learning with Multiparameter Persistent Homology
CDS
  • 批准号:
    2324353
  • 财政年份:
    2023
  • 资助金额:
    $ 25万
  • 项目类别:
    Continuing Grant
Collaborative Research: CDS&E-MSS: Community detection via covariance structures
合作研究:CDS
  • 批准号:
    2401020
  • 财政年份:
    2023
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
Collaborative Research: CDS&E-MSS: Deep Network Compression and Continual Learning: Theory and Application
合作研究:CDS
  • 批准号:
    2053448
  • 财政年份:
    2021
  • 资助金额:
    $ 25万
  • 项目类别:
    Continuing Grant
CDS&E-MSS: Optimal Recovery in the Age of Data Science
CDS
  • 批准号:
    2053172
  • 财政年份:
    2021
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
Collaborative Research: CDS&E-MSS: Deep Network Compression and Continual Learning: Theory and Application
合作研究:CDS
  • 批准号:
    2053480
  • 财政年份:
    2021
  • 资助金额:
    $ 25万
  • 项目类别:
    Continuing Grant
Probing microenvironmental immunobiology to support understanding of novel anti-cancer biotherapeutic interventions in MSS colorectal cancer
探索微环境免疫生物学以支持对 MSS 结直肠癌新型抗癌生物治疗干预措施的理解
  • 批准号:
    2435644
  • 财政年份:
    2020
  • 资助金额:
    $ 25万
  • 项目类别:
    Studentship
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了