BIGDATA: F: Learning Big Bayesian Networks
BIGDATA:F:学习大贝叶斯网络
基本信息
- 批准号:1546098
- 负责人:
- 金额:$ 91.93万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2015
- 资助国家:美国
- 起止时间:2015-10-01 至 2020-09-30
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
A fundamental problem in analyzing big data is to extract and represent the relations among the huge number of variables in a dataset. For example, in a genomic dataset, one may want to find out the dependence among a large number of genetic variations and various disease states. The Bayesian network is a commonly used class of mathematical models to represent such complex relations among a collection of variables, with wide applications in many scientific fields, ranging from the biomedical sciences to the social sciences. The goal of this project is to develop statistical and machine learning methods to construct Bayesian networks from big data, where the datasets may contain thousands to millions of variables. This is a challenging problem, particularly for large networks, as seen from the fact that state-of-the-art methods can barely handle thousands of variables. In this project, a novel divide-and-conquer approach will be developed and implemented as open-source packages for public use. The PIs will also study the theoretical properties of key components of this approach. Through seminar organization and educational activities in both graduate and undergraduate training, the cutting-edge research in this project will be communicated immediately to a much broader audience.The proposed approach consists of three main components: Partition, Estimation and Fusion (PEF). In the partition stage, spectral clustering will be embedded into an iterative subsampling approach to efficiently group variables into clusters. In the estimation stage, a few new methods will be developed to estimate the structure of a Bayesian network for each cluster of nodes, which serves as a subgraph of the big network. These methods include convex relaxations for permutations, fast algorithms for large-scale regularized estimation of the parameters of a Bayesian network, and novel formulations for discrete data. The final fusion stage will merge subgraphs into one big Bayesian network via a new method based on multiple-response sparse regression. Rigorous analysis of the PEF learning strategy for Bayesian networks under high-dimensional scaling will be conducted to provide theoretical guarantees for the methods and the algorithms.
分析大数据的一个基本问题是提取和表示数据集中大量变量之间的关系。例如,在基因组数据集中,人们可能想要找出大量遗传变异和各种疾病状态之间的依赖性。贝叶斯网络是一种常用的数学模型,用于表示变量集合之间的复杂关系,在许多科学领域中具有广泛的应用,从生物医学科学到社会科学。该项目的目标是开发统计和机器学习方法,从大数据中构建贝叶斯网络,其中数据集可能包含数千到数百万个变量。这是一个具有挑战性的问题,特别是对于大型网络,因为最先进的方法几乎无法处理数千个变量。在这个项目中,将开发一种新的分而治之的方法,并将其作为开放源码软件包供公众使用。PI还将研究这种方法的关键组成部分的理论特性。 通过研究生和本科生培训中的研讨会组织和教育活动,该项目的前沿研究将立即传达给更广泛的受众。该方法包括三个主要部分:划分,估计和融合(PEF)。在划分阶段,谱聚类将嵌入到迭代子采样方法中,以有效地将变量分组到聚类中。在估计阶段,将开发一些新的方法来估计贝叶斯网络的每个节点簇的结构,这些节点簇作为大网络的子图。这些方法包括置换的凸松弛,贝叶斯网络参数的大规模正则化估计的快速算法,以及离散数据的新配方。最后的融合阶段将通过一种基于多响应稀疏回归的新方法将子图合并成一个大的贝叶斯网络。对高维尺度下贝叶斯网络的PEF学习策略进行了严格的分析,为方法和算法提供了理论保证。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Qing Zhou其他文献
Effects of booster seat sliding on responses and injuries of child occupant
加高座椅滑动对儿童乘员反应和伤害的影响
- DOI:
10.1504/ijvs.2018.10018894 - 发表时间:
2018 - 期刊:
- 影响因子:0
- 作者:
Liang Tang;Jiajia Zheng;Taotao Wu;Qing Zhou - 通讯作者:
Qing Zhou
Mitochondrial dysfunction caused by SIRT3 inhibition drives pro-inflammatory macrophage polarization in obesity
SIRT3 抑制引起的线粒体功能障碍驱动肥胖中促炎巨噬细胞极化
- DOI:
10.1002/oby.23707 - 发表时间:
- 期刊:
- 影响因子:6.9
- 作者:
Qing Zhou;Yuyan Wang;Zongshi Lu;Bowen Wang;Li Li;Mei You;Lijuan Wang;Tingbing Cao;Yu Zhao;Qiang Li;Aidi Mou;Wentao Shu;Hongbo He;Zhigang Zhao;Daoyan Liu;Zhiming Zhu;Peng Gao;Zhencheng Yan - 通讯作者:
Zhencheng Yan
Differential expression of CD300a/c on human TH1 and TH17 cells
CD300a/c在人TH1和TH17细胞上的差异表达
- DOI:
- 发表时间:
2011 - 期刊:
- 影响因子:3
- 作者:
V. R. Simhadri;John L. Mariano;Qing Zhou;K. Debell;F. Borrego - 通讯作者:
F. Borrego
Shape controlled flower-like silicon oxide nanowires and their pH response
形状控制的花状氧化硅纳米线及其 pH 响应
- DOI:
10.1016/j.apsusc.2011.01.038 - 发表时间:
2011 - 期刊:
- 影响因子:6.7
- 作者:
Qi Shao;R. Que;Mingwang Shao;Qing Zhou;D. Ma;Shuitong Lee - 通讯作者:
Shuitong Lee
HER2 Activation Factors in Arsenite-Exposed Bladder Epithelial Cells
亚砷酸盐暴露的膀胱上皮细胞中的 HER2 激活因子
- DOI:
10.1093/toxsci/kfy202 - 发表时间:
2018-08 - 期刊:
- 影响因子:3.8
- 作者:
Peiyu Jin;Jieyu Liu;Xiaoyan Wang;Li Yang;Qing Zhou;Xiaoli Lin;Shuhua Xi - 通讯作者:
Shuhua Xi
Qing Zhou的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Qing Zhou', 18)}}的其他基金
CDS&E-MSS: Causal Induction in Sequential Decision Processes
CDS
- 批准号:
2305631 - 财政年份:2023
- 资助金额:
$ 91.93万 - 项目类别:
Continuing Grant
CDS&E-MSS: Causal learning and inference on complex observational data
CDS
- 批准号:
1952929 - 财政年份:2020
- 资助金额:
$ 91.93万 - 项目类别:
Standard Grant
Monte Carlo methods for complex multimodal distributions with applications in Bayesian inference
复杂多峰分布的蒙特卡罗方法及其在贝叶斯推理中的应用
- 批准号:
1308376 - 财政年份:2013
- 资助金额:
$ 91.93万 - 项目类别:
Standard Grant
CAREER: Sparse Modeling Driven by Large-Scale Genomic Data
职业:大规模基因组数据驱动的稀疏建模
- 批准号:
1055286 - 财政年份:2011
- 资助金额:
$ 91.93万 - 项目类别:
Continuing Grant
Statistical Methods for Integrated Gene Regulation Analyses
综合基因调控分析的统计方法
- 批准号:
0805491 - 财政年份:2008
- 资助金额:
$ 91.93万 - 项目类别:
Continuing Grant
相似国自然基金
Scalable Learning and Optimization: High-dimensional Models and Online Decision-Making Strategies for Big Data Analysis
- 批准号:
- 批准年份:2024
- 资助金额:万元
- 项目类别:合作创新研究团队
Understanding structural evolution of galaxies with machine learning
- 批准号:
- 批准年份:2022
- 资助金额:10.0 万元
- 项目类别:省市级项目
煤矿安全人机混合群智感知任务的约束动态多目标Q-learning进化分配
- 批准号:
- 批准年份:2022
- 资助金额:30 万元
- 项目类别:青年科学基金项目
基于领弹失效考量的智能弹药编队短时在线Q-learning协同控制机理
- 批准号:62003314
- 批准年份:2020
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
集成上下文张量分解的e-learning资源推荐方法研究
- 批准号:61902016
- 批准年份:2019
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
具有时序迁移能力的Spiking-Transfer learning (脉冲-迁移学习)方法研究
- 批准号:61806040
- 批准年份:2018
- 资助金额:20.0 万元
- 项目类别:青年科学基金项目
基于Deep-learning的三江源区冰川监测动态识别技术研究
- 批准号:51769027
- 批准年份:2017
- 资助金额:38.0 万元
- 项目类别:地区科学基金项目
具有时序处理能力的Spiking-Deep Learning(脉冲深度学习)方法研究
- 批准号:61573081
- 批准年份:2015
- 资助金额:64.0 万元
- 项目类别:面上项目
基于有向超图的大型个性化e-learning学习过程模型的自动生成与优化
- 批准号:61572533
- 批准年份:2015
- 资助金额:66.0 万元
- 项目类别:面上项目
E-Learning中学习者情感补偿方法的研究
- 批准号:61402392
- 批准年份:2014
- 资助金额:26.0 万元
- 项目类别:青年科学基金项目
相似海外基金
BIGDATA: IA: Collaborative Research: Asynchronous Distributed Machine Learning Framework for Multi-Site Collaborative Brain Big Data Mining
BIGDATA:IA:协作研究:用于多站点协作大脑大数据挖掘的异步分布式机器学习框架
- 批准号:
2348159 - 财政年份:2023
- 资助金额:
$ 91.93万 - 项目类别:
Standard Grant
BIGDATA: IA: Collaborative Research: Asynchronous Distributed Machine Learning Framework for Multi-Site Collaborative Brain Big Data Mining
BIGDATA:IA:协作研究:用于多站点协作大脑大数据挖掘的异步分布式机器学习框架
- 批准号:
1837964 - 财政年份:2019
- 资助金额:
$ 91.93万 - 项目类别:
Standard Grant
BIGDATA: IA: Collaborative Research: Asynchronous Distributed Machine Learning Framework for Multi-Site Collaborative Brain Big Data Mining
BIGDATA:IA:协作研究:用于多站点协作大脑大数据挖掘的异步分布式机器学习框架
- 批准号:
1837956 - 财政年份:2019
- 资助金额:
$ 91.93万 - 项目类别:
Standard Grant
BIGDATA: IA: Collaborative Research: Asynchronous Distributed Machine Learning Framework for Multi-Site Collaborative Brain Big Data Mining
BIGDATA:IA:协作研究:用于多站点协作大脑大数据挖掘的异步分布式机器学习框架
- 批准号:
1837999 - 财政年份:2019
- 资助金额:
$ 91.93万 - 项目类别:
Standard Grant
BIGDATA: F: Statistical Foundation of Predictivity: A Novel Architecture for Big Data Learning
BIGDATA:F:预测性的统计基础:大数据学习的新颖架构
- 批准号:
1741191 - 财政年份:2018
- 资助金额:
$ 91.93万 - 项目类别:
Standard Grant
BIGDATA: Collaborative Research: F: Big Data, It's Not So Big: Exploiting Low-Dimensional Geometry for Learning and Inference
BIGDATA:协作研究:F:大数据,它并不是那么大:利用低维几何进行学习和推理
- 批准号:
1663870 - 财政年份:2016
- 资助金额:
$ 91.93万 - 项目类别:
Standard Grant
BIGDATA: EAGER: Deep Learning in Higher Education Big Data to Explore Latent Student Archetypes and Knowledge Profiles
BIGDATA:EAGER:高等教育大数据中的深度学习探索潜在学生原型和知识概况
- 批准号:
1547055 - 财政年份:2015
- 资助金额:
$ 91.93万 - 项目类别:
Standard Grant
BIGDATA: Collaborative Research: F: Big Data, It's Not So Big: Exploiting Low-Dimensional Geometry for Learning and Inference
BIGDATA:协作研究:F:大数据,它并不是那么大:利用低维几何进行学习和推理
- 批准号:
1546331 - 财政年份:2015
- 资助金额:
$ 91.93万 - 项目类别:
Standard Grant
BIGDATA: Collaborative Research: F: IA: Statistical Learning for Big Data with Random Projections
BIGDATA:协作研究:F:IA:随机投影大数据的统计学习
- 批准号:
1545994 - 财政年份:2015
- 资助金额:
$ 91.93万 - 项目类别:
Standard Grant
BIGDATA: F: New Algorithms of Online Machine Learning for Big Data
BIGDATA:F:大数据在线机器学习的新算法
- 批准号:
1545995 - 财政年份:2015
- 资助金额:
$ 91.93万 - 项目类别:
Standard Grant














{{item.name}}会员




