CAREER: Super-Quantile Based Methods for Analyzing Large-Scale Heterogenous Data

职业:基于超分位数的大规模异构数据分析方法

基本信息

项目摘要

Data-driven decision-making has become ubiquitous across many scientific disciplines and in every aspect of life. As society relies more heavily on statistical modeling to make decisions, it becomes imperative for statistical methods to be able to model heterogenous data so that different decisions that will lead to better outcomes for different subgroups can be made. This is appealing in the big data era as data-rich settings allow statistical models to be trained to be more flexible and robust to heterogeneous data. This project focuses on developing a new class of statistical methods for modeling large-scale heterogenous data based on the super-quantile (tail average), also referred to as the expected shortfall or conditional value-at-risk. The methods under development will have the potential to answer questions that cannot be directly answered previously using existing tools in different fields such as climate science, neuroscience, finance, and health disparity research. The project will allow undergraduate and graduate students to work on cutting-edge methods for modeling data heterogeneity. In addition, a graduate-level course on data heterogeneity will be developed. The investigator will also engage in K-12 educational outreach in collaboration with the Center for Educational Outreach at the University of Michigan.With the abundance of data, there has been growing interest in modeling large-scale heterogeneous data for decision-making. Quantile regression is one representative statistical tool for modeling heterogeneous data, but one limitation is that it focuses on a specific quantile level and may not be the best approach for answering scientific questions that involve aggregate information of the lower/upper tail of the distribution of interest. The investigator studies the development of a new class of super-quantile-based tools to help practitioners answer such questions. There are three aims in this project: (i) establish theoretical foundations and develop scalable computational algorithms for fitting super-quantile regression in the big-data regime, high-dimensional regime, and data with outliers; (ii) develop super-quantile regression methods in the presence of unmeasured confounders; (iii) develop a series of super-quantile-based methods for analyzing different data types. The investigator will create a comprehensive platform, including software and e-book tutorials, to encourage using super-quantile-based methods.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
数据驱动的决策已经在许多科学学科和生活的方方面面变得无处不在。随着社会越来越多地依赖统计建模来做出决策,统计方法必须能够对异质数据进行建模,以便能够做出不同的决策,从而为不同的分组带来更好的结果。这在大数据时代很有吸引力,因为数据丰富的设置允许对统计模型进行培训,使其对异类数据更加灵活和稳健。这个项目的重点是开发一类新的统计方法,用于基于超分位数(尾部平均值)对大规模异质数据进行建模,也被称为预期缺口或条件风险值。正在开发的方法将有可能回答以前无法使用气候科学、神经科学、金融和健康差距研究等不同领域的现有工具直接回答的问题。该项目将允许本科生和研究生研究建模数据异质性的尖端方法。此外,还将开发一门关于数据异质性的研究生课程。该调查员还将与密歇根大学教育外展中心合作进行K-12教育外展。随着数据的丰富,人们对为决策而建模的大规模异质数据越来越感兴趣。分位数回归是建模异质数据的一种代表性统计工具,但它的一个局限性是它侧重于特定的分位数水平,并且可能不是回答涉及兴趣分布的下尾/上尾的聚集信息的科学问题的最佳方法。研究人员研究了一类新的基于超分位数的工具的开发,以帮助从业者回答这些问题。这个项目有三个目标:(I)建立理论基础并开发可扩展的计算算法,用于在大数据、高维和有异常值的数据中拟合超分位数回归;(Ii)在存在不可测量混杂因素的情况下开发超分位数回归方法;(Iii)开发一系列基于超分位数的方法来分析不同的数据类型。研究人员将创建一个综合平台,包括软件和电子书教程,以鼓励使用基于超级分位数的方法。这一奖项反映了NSF的法定使命,并通过使用基金会的智力优势和更广泛的影响审查标准进行评估,被认为值得支持。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Kean Ming Tan其他文献

Statistical Inference for Covariate-Adjusted and Interpretable Generalized Factor Model with Application to Testing Fairness
协变量调整和可解释的广义因子模型的统计推断及其在测试公平性中的应用
  • DOI:
  • 发表时间:
    2024
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Ouyang Jing;Chengyu Cui;Kean Ming Tan;Gongjun Xu
  • 通讯作者:
    Gongjun Xu
Selection Bias Correction and Eect Size Estimation under Dependence
依赖性下的选择偏差校正和效应大小估计
  • DOI:
  • 发表时间:
    2014
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Kean Ming Tan;N. Simon;D. Witten
  • 通讯作者:
    D. Witten
J ul 2 01 9 Robust convex clustering : How does the fusion penalty enhance robustness ?
Jul 2 01 9 鲁棒凸聚类:融合惩罚如何增强鲁棒性?
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Chenyu Liu;Qiang Sun;Kean Ming Tan
  • 通讯作者:
    Kean Ming Tan
Estimation of complier expected shortfall treatment effects with a binary instrumental variable
使用二元工具变量估计编译者预期缺口治疗效果
  • DOI:
    10.1016/j.jeconom.2023.105572
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    6.3
  • 作者:
    B. Wei;Kean Ming Tan;Xuming He
  • 通讯作者:
    Xuming He
Supplement to “ Smoothed Quantile Regression with Large-Scale Inference ”
“大规模推理的平滑分位数回归”的补充
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Xuming He;Xiaoou Pan;Kean Ming Tan;Wen
  • 通讯作者:
    Wen

Kean Ming Tan的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Kean Ming Tan', 18)}}的其他基金

Collaborative Research: Inference and Decentralized Computing for Quantile Regression and Other Non-Smooth Methods
合作研究:分位数回归和其他非平滑方法的推理和分散计算
  • 批准号:
    2113346
  • 财政年份:
    2021
  • 资助金额:
    $ 41.04万
  • 项目类别:
    Standard Grant
Statistical Machine Learning Methods for Complex Data Sets
复杂数据集的统计机器学习方法
  • 批准号:
    1949730
  • 财政年份:
    2019
  • 资助金额:
    $ 41.04万
  • 项目类别:
    Standard Grant
Statistical Machine Learning Methods for Complex Data Sets
复杂数据集的统计机器学习方法
  • 批准号:
    1811315
  • 财政年份:
    2018
  • 资助金额:
    $ 41.04万
  • 项目类别:
    Standard Grant

相似国自然基金

水稻 SUPER WOMAN 5 (SPW5) 基因调控花器官发育的分子机制解析
  • 批准号:
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
肌细胞生成素与Super-enhancer互作形成正反馈环路促进肌损伤修复的机制研究
  • 批准号:
    n/a
  • 批准年份:
    2023
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
水稻SUPER WOMAN 3 (SPW3) 基因调控花器官发育的分子机制研究
  • 批准号:
  • 批准年份:
    2021
  • 资助金额:
    30 万元
  • 项目类别:
水稻SUPER WOMAN 3(SPW3)基因调控花器官发育的分子机制研究
  • 批准号:
    32100287
  • 批准年份:
    2021
  • 资助金额:
    24.00 万元
  • 项目类别:
    青年科学基金项目
基于质谱的Super SILAC结合膜富集技术解析镁离子相关蛋白调控网络在Ⅲ型前列腺炎中的作用机制研究
  • 批准号:
    22164007
  • 批准年份:
    2021
  • 资助金额:
    35 万元
  • 项目类别:
    地区科学基金项目
Triptolide通过调控Super-enhancer抑制抗体产生改善抗体介导的移植肾排斥反应
  • 批准号:
  • 批准年份:
    2021
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
Super-enhancer驱动的LINC01468通过增强癌基因翻译促进鼻咽癌发生发展的机制研究
  • 批准号:
    2020JJ4838
  • 批准年份:
    2020
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
水稻SUPER BRABCH 1基因调控穗发育的分子机制研究
  • 批准号:
    31971919
  • 批准年份:
    2019
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目
Max-plus代数上的super本征问题
  • 批准号:
    11901486
  • 批准年份:
    2019
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
Super-lncRNA与super-enhancer的相互作用在乳腺癌发生发展中作用机制的研究
  • 批准号:
    81902680
  • 批准年份:
    2019
  • 资助金额:
    19.0 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Super-resolution platform to accelerate biological and molecular research
加速生物和分子研究的超分辨率平台
  • 批准号:
    LE240100134
  • 财政年份:
    2024
  • 资助金额:
    $ 41.04万
  • 项目类别:
    Linkage Infrastructure, Equipment and Facilities
SUPer-REsolution non-invasive Muscle measurements with miniaturised magnetIc SEnsors (SUPREMISE)
使用微型磁性传感器 (SUPREMISE) 进行超分辨率非侵入性肌肉测量
  • 批准号:
    EP/X031950/1
  • 财政年份:
    2024
  • 资助金额:
    $ 41.04万
  • 项目类别:
    Fellowship
Super selective hydrogen permeation through mixed proton and electron conducting asymmetric graphene based membrane
通过混合质子和电子传导不对称石墨烯基膜的超选择性氢渗透
  • 批准号:
    24K17588
  • 财政年份:
    2024
  • 资助金额:
    $ 41.04万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
Super流産の原因遺伝子の同定と胎児染色体正常原因不明習慣流産の病態解明
超级流产基因的鉴定和胎儿染色体正常化以及不明原因习惯性流产病理学的阐明
  • 批准号:
    23K24486
  • 财政年份:
    2024
  • 资助金额:
    $ 41.04万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Quantum-limited super-resolution imaging
量子限制超分辨率成像
  • 批准号:
    EP/Y029127/1
  • 财政年份:
    2024
  • 资助金额:
    $ 41.04万
  • 项目类别:
    Fellowship
Developing single-photon super-resolution microscopy
开发单光子超分辨率显微镜
  • 批准号:
    EP/Y023137/1
  • 财政年份:
    2024
  • 资助金额:
    $ 41.04万
  • 项目类别:
    Research Grant
ASL法を用いた門脈灌流画像の臨床応用及びsuper-selective MRAの有用性評価
ASL法门静脉灌注成像的临床应用及超选择性MRA的有效性评价
  • 批准号:
    24K18753
  • 财政年份:
    2024
  • 资助金额:
    $ 41.04万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
Advancing Understanding of Super-Coarse and Giant Dust Particles via Novel Measurements of Emission and Transport
通过新颖的排放和传输测量方法增进对超粗和巨型灰尘颗粒的了解
  • 批准号:
    2336111
  • 财政年份:
    2024
  • 资助金额:
    $ 41.04万
  • 项目类别:
    Continuing Grant
肺小細胞癌におけるmiRNAとSuper Enhancerの関連について
关于小细胞肺癌中miRNA与SuperEnhancer的关系
  • 批准号:
    24KJ0546
  • 财政年份:
    2024
  • 资助金额:
    $ 41.04万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
SBIR Phase I: Process for Producing Steel using Super-Pure Iron Ore Powder (SPIOP) and Hydrogen
SBIR 第一阶段:使用超纯铁矿粉 (SPIOP) 和氢气生产钢的工艺
  • 批准号:
    2231649
  • 财政年份:
    2023
  • 资助金额:
    $ 41.04万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了