Collaborative Research: Nonparametric Bayesian Aggregation for Massive Data

协作研究:海量数据的非参数贝叶斯聚合

基本信息

  • 批准号:
    1712907
  • 负责人:
  • 金额:
    $ 14万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Continuing Grant
  • 财政年份:
    2017
  • 资助国家:
    美国
  • 起止时间:
    2017-09-01 至 2020-08-31
  • 项目状态:
    已结题

项目摘要

Modern massive data appear in increasing volume and high heterogeneity. Examples include internet searches, social networks, mobile devices, satellites, genomics, medical scans, etc. Bayesian approaches are particularly useful in such context since the complex structures in the data can be naturally incorporated in Bayesian hierarchical models. Besides, uncertainty quantification can be easily executed through Bayesian computation. However, due to storage and computational bottlenecks, traditional Bayesian computation implemented in a single machine is no longer applicable to modern massive data. In this project, a set of nonparametric Bayesian aggregation procedures with theoretical justifications are developed based on a standard parallel computing strategy known as Divide-and-Conquer. This research will significantly enhance the availability of Bayesian tools and software for analyzing massive data. The educational plan of the project will be in the form of graduate student advising and offering of special topics courses. This project consists of three major components. First, the PIs will establish a Gaussian approximation of general nonparametric posterior distributions which serves as a theoretical foundation for general distributed Bayesian algorithms. Second, the PIs will develop a nonparametric Bayesian aggregation procedure with theoretical guarantees that is particularly useful to handle massive data in a parallel fashion. Third, the PIs will develop an efficient parallel Markov Chain Monte Carlo (MCMC) algorithm for nonparametric Bayesian models which will perform as well as traditional MCMC with substantially less computational costs. This research will lead to an emergence of "Splitotics (Split+Asymptotics) Theory" providing theoretical guidelines for Bayesian practices. The smoothing spline inference results recently obtained by the PIs will be used as a promising tool for achieving the above goals.
现代大规模数据的体积增加和高异质性。示例包括互联网搜索,社交网络,移动设备,卫星,基因组学,医学扫描等。贝叶斯方法在这种情况下特别有用,因为数据中的复杂结构可以自然地纳入贝叶斯层次结构模型中。此外,不确定性量化可以通过贝叶斯计算轻松执行。但是,由于存储和计算瓶颈,单台机器中实施的传统贝叶斯计算不再适用于现代大型数据。在这个项目中,一组具有理论理由的非参数贝叶斯聚合程序是基于标准的平行计算策略(称为分裂和串联的标准计算策略)开发的。这项研究将大大提高贝叶斯工具和软件的可用性,以分析大量数据。该项目的教育计划将以研究生的形式为特殊主题课程提供建议和提供。该项目由三个主要组成部分组成。首先,PI将建立一般非参数后分布的高斯近似,这是一般分布式贝叶斯算法的理论基础。其次,PIS将开发非参数贝叶斯聚合程序,并具有理论保证,这对于以并行方式处理大量数据特别有用。第三,PIS将开发出一种非参数贝叶斯模型的有效的平行马尔可夫链蒙特卡洛(MCMC)算法,该算法将与传统的MCMC相同,并且计算成本较小。这项研究将导致出现“分裂学(分裂+渐近学)理论”,从而为贝叶斯实践提供了理论指南。 PI最近获得的平滑样条推断结果将用作实现上述目标的有前途的工具。

项目成果

期刊论文数量(17)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
delete this
删除这个
High Dimensional Inference in Partially Linear Models
  • DOI:
    10.2139/ssrn.3015397
  • 发表时间:
    2017-08
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Ying Zhu;Zhuqing Yu;Guang Cheng
  • 通讯作者:
    Ying Zhu;Zhuqing Yu;Guang Cheng
Gaussian approximation for high dimensional vector under physical dependence
  • DOI:
    10.3150/17-bej939
  • 发表时间:
    2018-11
  • 期刊:
  • 影响因子:
    1.5
  • 作者:
    Xianyang Zhang;Guang Cheng
  • 通讯作者:
    Xianyang Zhang;Guang Cheng
Early Stopping for Nonparametric Testing
非参数测试的提前停止
Tensor Graphical Model: Non-Convex Optimization and Statistical Inference
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Guang Cheng其他文献

PDA-cross-linked beta-cyclodextrin: a novel adsorbent for the removal of BPA and cationic dyes.
PDA 交联 β-环糊精:一种用于去除 BPA 和阳离子染料的新型吸附剂。
  • DOI:
    10.2166/wst.2020.286
  • 发表时间:
    2020-06
  • 期刊:
  • 影响因子:
    2.7
  • 作者:
    Jianyu Wang;Guang Cheng;Jian Lu;Huafeng Chen;Yanbo Zhou
  • 通讯作者:
    Yanbo Zhou
BadGD: A unified data-centric framework to identify gradient descent vulnerabilities
BadGD:一个以数据为中心的统一框架,用于识别梯度下降漏洞
  • DOI:
    10.48550/arxiv.2405.15979
  • 发表时间:
    2024
  • 期刊:
  • 影响因子:
    0
  • 作者:
    ChiHua Wang;Guang Cheng
  • 通讯作者:
    Guang Cheng
Community-base Fault Diagnosis Using Incremental Belief Revision
使用增量置信修正进行基于社区的故障诊断
Identifying Video Resolution from Encrypted QUIC Streams in Segment-combined Transmission Scenarios
分段组合传输场景下加密QUIC流视频分辨率识别
RBAS: A Real-Time User Behavior Analysis System for Internet TV in Cloud Computing
RBAS:云计算下的互联网电视实时用户行为分析系统

Guang Cheng的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Guang Cheng', 18)}}的其他基金

Conference: UCLA Synthetic Data Workshop
会议:加州大学洛杉矶分校综合数据研讨会
  • 批准号:
    2309349
  • 财政年份:
    2023
  • 资助金额:
    $ 14万
  • 项目类别:
    Standard Grant
Collaborative Research: SaTC: CORE: Small: Differentially Private Data Synthesis: Practical Algorithms and Statistical Foundations
协作研究:SaTC:核心:小型:差分隐私数据合成:实用算法和统计基础
  • 批准号:
    2247795
  • 财政年份:
    2023
  • 资助金额:
    $ 14万
  • 项目类别:
    Continuing Grant
I-Corps: Trustworthy Synthetic Data Generation
I-Corps:值得信赖的综合数据生成
  • 批准号:
    2317549
  • 财政年份:
    2023
  • 资助金额:
    $ 14万
  • 项目类别:
    Standard Grant
Collaborative Research: Semiparametric ODE Models for Complex Gene Regulatory Networks
合作研究:复杂基因调控网络的半参数 ODE 模型
  • 批准号:
    1418202
  • 财政年份:
    2014
  • 资助金额:
    $ 14万
  • 项目类别:
    Standard Grant
CAREER: Bootstrap M-estimation in Semi-Nonparametric Models
职业:半非参数模型中的 Bootstrap M 估计
  • 批准号:
    1151692
  • 财政年份:
    2012
  • 资助金额:
    $ 14万
  • 项目类别:
    Continuing Grant
General Semiparametric Inference via Bootstrap Sampling
通过 Bootstrap 采样进行一般半参数推理
  • 批准号:
    0906497
  • 财政年份:
    2009
  • 资助金额:
    $ 14万
  • 项目类别:
    Standard Grant

相似国自然基金

局部可交换数据的贝叶斯非参数模型及其在精算中的应用研究
  • 批准号:
    72371186
  • 批准年份:
    2023
  • 资助金额:
    39.00 万元
  • 项目类别:
    面上项目
非确定参数下船舶直流微网稳定性分析及自适应控制研究
  • 批准号:
    52301394
  • 批准年份:
    2023
  • 资助金额:
    30.00 万元
  • 项目类别:
    青年科学基金项目
非平坦环境下SINS/DVL海底参数自主估计与广域导航方法研究
  • 批准号:
    62303157
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
蚀刻用含氟分子激发动力学参数的快电子和非弹性X射线散射实验研究
  • 批准号:
    12334010
  • 批准年份:
    2023
  • 资助金额:
    239 万元
  • 项目类别:
    重点项目
面向毫米波无线通信系统的非显式参数化数字孪生关键技术研究
  • 批准号:
    62301337
  • 批准年份:
    2023
  • 资助金额:
    30.00 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Collaborative Research: Nonparametric Bayesian Aggregation for Massive Data
协作研究:海量数据的非参数贝叶斯聚合
  • 批准号:
    2005746
  • 财政年份:
    2019
  • 资助金额:
    $ 14万
  • 项目类别:
    Continuing Grant
CDS&E: Collaborative Research: Scalable Nonparametric Learning for Massive Data with Statistical Guarantees
CDS
  • 批准号:
    2005779
  • 财政年份:
    2019
  • 资助金额:
    $ 14万
  • 项目类别:
    Standard Grant
Collaborative Research: New Bayesian Nonparametric Paradigms of Personalized Medicine for Lung Cancer
合作研究:肺癌个体化医疗的新贝叶斯非参数范式
  • 批准号:
    1922567
  • 财政年份:
    2018
  • 资助金额:
    $ 14万
  • 项目类别:
    Continuing Grant
CDS&E: Collaborative Research: Scalable Nonparametric Learning for Massive Data with Statistical Guarantees
CDS
  • 批准号:
    1821157
  • 财政年份:
    2018
  • 资助金额:
    $ 14万
  • 项目类别:
    Standard Grant
Collaborative Research: New Bayesian Nonparametric Paradigms of Personalized Medicine for Lung Cancer
合作研究:肺癌个体化医疗的新贝叶斯非参数范式
  • 批准号:
    1854003
  • 财政年份:
    2018
  • 资助金额:
    $ 14万
  • 项目类别:
    Continuing Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了