Advances in Bayesian Nonparametric Methods for Jointly Modeling Multiple Data Sets
联合建模多个数据集的贝叶斯非参数方法的进展
基本信息
- 批准号:2013930
- 负责人:
- 金额:$ 20万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Continuing Grant
- 财政年份:2020
- 资助国家:美国
- 起止时间:2020-07-01 至 2024-06-30
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
Bayesian nonparametrics is a statistical modeling framework that combines flexibility of classical nonparametric statistical methods with principled assessment of uncertainty under the Bayesian paradigm. Traditional Bayesian nonparametric methods, however, have largely focused on models based on a single data set, while many modern statistical scenarios involve multiple data sets of similar nature collected under related or comparative conditions. This project develops a suite of new modeling and computational strategies that are tailored for effective joint modeling of multiple data sets in ways that (i) capture cross-sample variation in modern complex data, and (ii) are computationally efficient to allow application to massive data. The developed methodology will have impact in a range of fields including biology, economics, education, astrophysics, political science, and climate science, where the task is to properly characterize variation across data sets. The project provides excellent research training opportunities for graduate students.Novel models, methods, and algorithms will be developed in the context of two classes of widely used Bayesian nonparametric models: (i) mixture models with discrete random measure (DRM) mixing distributions (e.g., Dirichlet process mixtures) and (ii) tree-structured random measure (TSRM) models (e.g., Polya tree type models). These two model classes are different in nature with each having its own advantages and limitations in modeling multiple data sets, and as such the strategies in advancing these two model classes are distinct. A key limitation of DRM mixtures in modeling multiple samples is their lack of flexibility in characterizing the cross-sample variation, and thus a new latent variable modeling strategy will be developed for substantially enhancing their capacity in this regard. Also to be investigated are the theoretical and empirical properties of the resulting dispersion mixture models, as well as generalizations of this strategy in broader ranges of hierarchical models where incorporating flexible cross-sample variation in observed and latent quantities is important. For TSRM models, capable of characterizing complex cross-sample variation, the focus is on addressing their lack of scalability, both computational and statistical, with respect to increasing dimensionality as well as their sensitivity to the underlying tree structures, a critical component for building such models. The development for these two model classes will form a powerful and general toolbox that can be applied in a variety of scientific and engineering problems involving the analysis of multiple related data sets.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
贝叶斯非参数统计是一种统计建模框架,它结合了经典非参数统计方法的灵活性和贝叶斯范式下对不确定性的原则性评估。然而,传统的贝叶斯非参数方法主要关注基于单个数据集的模型,而许多现代统计场景涉及在相关或比较条件下收集的多个性质相似的数据集。该项目开发了一套新的建模和计算策略,为多个数据集的有效联合建模量身定做,其方式(I)捕捉现代复杂数据中的交叉样本变化,(Ii)计算高效,以允许应用于海量数据。开发的方法将在生物学、经济学、教育、天体物理学、政治学和气候科学等一系列领域产生影响,这些领域的任务是正确描述数据集之间的差异。该项目为研究生提供了极好的研究培训机会。新的模型、方法和算法将在两类广泛使用的贝叶斯非参数模型的背景下开发:(I)具有离散随机测量(DRM)混合分布的混合模型(例如,Dirichlet过程混合)和(Ii)树结构随机测量(TSRM)模型(例如,Polya树型模型)。这两个模型类本质上是不同的,在对多个数据集进行建模时,每个模型类都有自己的优势和局限性,因此,推进这两个模型类的策略是不同的。在对多个样本建模时,DRM混合模型的一个关键限制是它们在描述跨样本变化方面缺乏灵活性,因此将开发一种新的潜变量建模策略,以显著提高它们在这方面的能力。还将研究由此产生的弥散混合模型的理论和经验性质,以及这一策略在更广泛的分层模型范围内的推广,在这些模型中,纳入观测和潜在量的灵活的跨样本变化是重要的。对于能够描述复杂的跨样本变化的TSRM模型,重点是解决它们在增加维度方面缺乏计算和统计上的可扩展性,以及它们对建立这种模型的关键组成部分--树结构的敏感性。这两个模型类的开发将形成一个强大而通用的工具箱,可以应用于涉及分析多个相关数据集的各种科学和工程问题。该奖项反映了NSF的法定使命,并通过使用基金会的智力优势和更广泛的影响审查标准进行评估,被认为值得支持。
项目成果
期刊论文数量(3)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Learning Asymmetric and Local Features in Multi-Dimensional Data Through Wavelets With Recursive Partitioning
- DOI:10.1109/tpami.2021.3110403
- 发表时间:2017-11
- 期刊:
- 影响因子:23.6
- 作者:Meng Li;Li Ma
- 通讯作者:Meng Li;Li Ma
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Li Ma其他文献
Quantum Chemical Calculations on Reaction Path of Bituminous Char Heterogeneous Denitration
烟煤多相脱硝反应路径的量子化学计算
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
Yongfeng Qi;Meiting Wang;Liang Xu;Zhengming Li;Yang Zhang;Li Ma;Jingjing Huang - 通讯作者:
Jingjing Huang
A new species of Minagenia Banks, 1934 (Hymenoptera, Pompilidae) from China, with the key to species
中国Minagenia Banks一新种,1934年(膜翅目,Pompilidae),附物种钥匙
- DOI:
- 发表时间:
2014 - 期刊:
- 影响因子:0.9
- 作者:
Xiao-Ling Ji;Chong-Yang Li;Li Ma;Qiang Li - 通讯作者:
Qiang Li
Evolution of dispersal in advective homogeneous environments
平流均匀环境中扩散的演变
- DOI:
10.3934/dcds.2020247 - 发表时间:
2020 - 期刊:
- 影响因子:1.1
- 作者:
Li Ma;De Tang - 通讯作者:
De Tang
Employee Characteristics and Management
员工特点与管理
- DOI:
10.1007/978-3-642-54417-0_8 - 发表时间:
2014 - 期刊:
- 影响因子:0
- 作者:
Li Ma - 通讯作者:
Li Ma
La place de la religion dans l'éducation par le YMCA des travailleurs chinois de la Grande Guerre
大战争中国青年会宗教教育场所
- DOI:
10.3917/gmcc.235.0101 - 发表时间:
2009 - 期刊:
- 影响因子:0
- 作者:
Li Ma - 通讯作者:
Li Ma
Li Ma的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Li Ma', 18)}}的其他基金
Collaborative Research: Bayesian Residual Learning and Random Recursive Partitioning Methods for Gaussian Process Modeling
合作研究:高斯过程建模的贝叶斯残差学习和随机递归划分方法
- 批准号:
2152999 - 财政年份:2022
- 资助金额:
$ 20万 - 项目类别:
Standard Grant
ISBA 2020: 15th World Meeting of the International Society for Bayesian Analysis -- June 29-July 3, 2020
ISBA 2020:国际贝叶斯分析学会第十五届世界会议——2020年6月29日至7月3日
- 批准号:
1938935 - 财政年份:2020
- 资助金额:
$ 20万 - 项目类别:
Standard Grant
CAREER: Advances in Multi-scale Bayesian Inference and Learning on Massive Data
职业:多尺度贝叶斯推理和海量数据学习的进展
- 批准号:
1749789 - 财政年份:2018
- 资助金额:
$ 20万 - 项目类别:
Continuing Grant
Graphical Multi-Resolution Scanning for Cross-Sample Variation
针对跨样本变化的图形多分辨率扫描
- 批准号:
1612889 - 财政年份:2016
- 资助金额:
$ 20万 - 项目类别:
Continuing Grant
Bayesian Recursive Partitioning and Inference on the Structure of High-Dimensional Distributions
高维分布结构的贝叶斯递归划分和推理
- 批准号:
1309057 - 财政年份:2013
- 资助金额:
$ 20万 - 项目类别:
Continuing Grant
相似国自然基金
多元纵向数据与复发事件和终止事件的Bayesian联合模型研究
- 批准号:82173628
- 批准年份:2021
- 资助金额:52 万元
- 项目类别:面上项目
三维地质模型约束下地球化学场的Bayesian-MCMC推断
- 批准号:42072326
- 批准年份:2020
- 资助金额:63 万元
- 项目类别:面上项目
基于Bayesian Kriging模型的压射机构稳健优化设计基础研究
- 批准号:51875209
- 批准年份:2018
- 资助金额:59.0 万元
- 项目类别:面上项目
X射线图像分析中的MCMC-Bayesian理论与计算方法研究
- 批准号:U1830105
- 批准年份:2018
- 资助金额:62.0 万元
- 项目类别:联合基金项目
基于Bayesian位移场的SAR图像精确配准方法研究
- 批准号:41601345
- 批准年份:2016
- 资助金额:19.0 万元
- 项目类别:青年科学基金项目
多结局Bayesian联合生存模型及糖尿病并发症预测研究
- 批准号:81673274
- 批准年份:2016
- 资助金额:50.0 万元
- 项目类别:面上项目
基于Meta流行病学和Bayesian方法构建针刺干预无偏倚风险效果评价体系研究
- 批准号:81403276
- 批准年份:2014
- 资助金额:23.0 万元
- 项目类别:青年科学基金项目
BtoC电子商务中基于分层Bayesian网络的信任与声誉计算理论研究
- 批准号:71302080
- 批准年份:2013
- 资助金额:20.0 万元
- 项目类别:青年科学基金项目
基于Bayesian网络的坚硬顶板条件下煤与瓦斯突出预警控制机理研究
- 批准号:51274089
- 批准年份:2012
- 资助金额:80.0 万元
- 项目类别:面上项目
Bayesian实物期权及在信用风险决策中的应用
- 批准号:71071027
- 批准年份:2010
- 资助金额:23.0 万元
- 项目类别:面上项目
相似海外基金
Nonparametric Bayesian inference with single and multivariate random probability measures; heavy tailed time series.
使用单变量和多元随机概率测量的非参数贝叶斯推理;
- 批准号:
RGPIN-2018-04008 - 财政年份:2022
- 资助金额:
$ 20万 - 项目类别:
Discovery Grants Program - Individual
CAREER: Foundations for Bayesian Nonparametric Causal Inference
职业:贝叶斯非参数因果推理基础
- 批准号:
2144933 - 财政年份:2022
- 资助金额:
$ 20万 - 项目类别:
Continuing Grant
Nonparametric Bayesian inference with single and multivariate random probability measures; heavy tailed time series.
使用单变量和多元随机概率测量的非参数贝叶斯推理;
- 批准号:
RGPIN-2018-04008 - 财政年份:2021
- 资助金额:
$ 20万 - 项目类别:
Discovery Grants Program - Individual
Nonparametric Bayesian Methods for Joint Analysis of Recurrent Events and Survival Time
用于重复事件和生存时间联合分析的非参数贝叶斯方法
- 批准号:
2015428 - 财政年份:2020
- 资助金额:
$ 20万 - 项目类别:
Standard Grant
Bayesian Nonparametric Modeling and Inference Methods for Point Processes
点过程的贝叶斯非参数建模和推理方法
- 批准号:
1950902 - 财政年份:2020
- 资助金额:
$ 20万 - 项目类别:
Standard Grant
Nonparametric Bayesian inference with single and multivariate random probability measures; heavy tailed time series.
使用单变量和多元随机概率测量的非参数贝叶斯推理;
- 批准号:
RGPIN-2018-04008 - 财政年份:2020
- 资助金额:
$ 20万 - 项目类别:
Discovery Grants Program - Individual
Bayesian nonparametric learning for practical sequential decision making
用于实际顺序决策的贝叶斯非参数学习
- 批准号:
DE200100245 - 财政年份:2020
- 资助金额:
$ 20万 - 项目类别:
Discovery Early Career Researcher Award
Nonparametric inference and Bayesian computing
非参数推理和贝叶斯计算
- 批准号:
RGPIN-2015-05200 - 财政年份:2019
- 资助金额:
$ 20万 - 项目类别:
Discovery Grants Program - Individual
Nonparametric Bayesian inference with single and multivariate random probability measures; heavy tailed time series.
使用单变量和多元随机概率测量的非参数贝叶斯推理;
- 批准号:
RGPIN-2018-04008 - 财政年份:2019
- 资助金额:
$ 20万 - 项目类别:
Discovery Grants Program - Individual
A Bayesian nonparametric approach to superresolved tracking of multiple molecules inside living cells
贝叶斯非参数方法对活细胞内多个分子进行超分辨跟踪
- 批准号:
10294246 - 财政年份:2019
- 资助金额:
$ 20万 - 项目类别: