Structural Learning and Statistical Inference for Large-Scale Data

大规模数据的结构学习和统计推断

基本信息

  • 批准号:
    2013486
  • 负责人:
  • 金额:
    $ 12万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2020
  • 资助国家:
    美国
  • 起止时间:
    2020-08-15 至 2023-07-31
  • 项目状态:
    已结题

项目摘要

This project aims at developing new structure learning and statistical inference procedures for capturing some essential structures of large-scale data, emerging from scientific studies in genetics, biology, neuroscience, finance, and meteorology, among others. New tools for stochastic modeling, computational algorithms, and statistical inference applied to multi-channel brain EEG recordings, multi-subject fMRI and multiple neuron spike trains in neuroscience research, and identifying structural changes in climate data and copy number variation in genetics, will be developed. Outcomes of this study will help scientists to efficiently analyze large-scale imaging, temporal and spatial data, and thus will have broader impacts on our society through their direct impacts on these applications to science, public health, and information technology. Dissemination of these developments will enhance new knowledge discoveries, and strengthen interdisciplinary collaborations. The research will also be integrated with educational practice through designing either regular, seminar or short courses on new statistical approaches for analyzing complex data as well as benefitting the training and learning of undergraduate, graduate students and underrepresented minorities.This research work focuses on statistical learning of fundamentally distinct types of structures, with the ultimate goal of better understanding of complex systems. Motivated from inferring neural connectivity from the ensemble neural spike train data, Project 1 will learn the directed acyclic graph structure in a large Poisson network, underlying a wide array of multivariate point process data. The related probabilistic mechanism will provide new insights into understanding statistical properties of the estimators for graph parameters relevant to mining the causal relation among neurons. Inspired by feature extraction and source separation from multi-channel brain EEG recordings and non-linear temporal signal processing, Project 2 will develop a class of non-linear non-smooth combinations of structured component analysis (SCA) to extract hidden component signals from observed mixed signals. The SCA developed will be more broadly applicable in scientific studies. Motivated from identifying and understanding structural changes in climate trends, and structural variation in gene copy numbers associated with genetic diseases, Project 3 will develop a novel two-step adaptive procedure of jump detection, for simultaneously selecting the unknown number of jump points and detecting their locations in the flexible non-parametric regression model.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
该项目旨在开发新的结构学习和统计推断程序,用于捕获大规模数据的一些基本结构,这些数据来自遗传学,生物学,神经科学,金融和气象学等科学研究。将开发用于随机建模、计算算法和统计推断的新工具,这些工具适用于神经科学研究中的多通道脑EEG记录、多学科功能磁共振成像和多神经元尖峰序列,以及识别气候数据中的结构变化和遗传学中的拷贝数变异。这项研究的结果将帮助科学家有效地分析大规模成像,时间和空间数据,从而通过对这些应用的直接影响对我们的社会产生更广泛的影响科学,公共卫生和信息技术。这些发展的传播将促进新的知识发现,并加强跨学科合作。该研究还将通过设计用于分析复杂数据的新统计方法的定期,研讨会或短期课程与教育实践相结合,并使本科生,研究生和代表性不足的少数民族的培训和学习受益。这项研究工作侧重于基本不同类型结构的统计学习,最终目标是更好地理解复杂系统。从集成神经尖峰序列数据推断神经连接性的动机,项目1将学习大型泊松网络中的有向非循环图结构,该网络是各种多变量点过程数据的基础。相关的概率机制将提供新的见解,了解统计特性的估计相关的挖掘神经元之间的因果关系的图参数。受多通道脑电记录和非线性时间信号处理的特征提取和源分离的启发,项目2将开发一类非线性非平滑结构化成分分析(SCA)组合,从观察到的混合信号中提取隐藏成分信号。所开发的SCA将更广泛地适用于科学研究。从识别和理解气候趋势的结构变化,以及与遗传疾病相关的基因拷贝数的结构变化出发,项目3将开发一种新的两步自适应跳跃检测程序,用于同时选择未知数目的跳跃点并检测它们在柔性非接触区域中的位置,该奖项反映了NSF的法定使命,并通过使用基金会的知识价值和更广泛的影响审查标准进行评估,被认为值得支持。

项目成果

期刊论文数量(7)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
On simultaneous calibration of two-sample t-tests for high-dimension low-sample-size data
高维低样本数据双样本t检验的同时校准
  • DOI:
    10.5705/ss.202018.0467
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    1.4
  • 作者:
    Zhang, Chunming;Jia, Shengji;Wu, Yongfeng
  • 通讯作者:
    Wu, Yongfeng
Robust estimation in regression and classification methods for large dimensional data
  • DOI:
    10.1007/s10994-023-06349-2
  • 发表时间:
    2023-07
  • 期刊:
  • 影响因子:
    7.5
  • 作者:
    Chunming Zhang;Lixing Zhu;Yanbo Shen
  • 通讯作者:
    Chunming Zhang;Lixing Zhu;Yanbo Shen
Empirical likelihood inference in autoregressive models with time-varying variances
  • DOI:
    10.1080/24754269.2021.1913977
  • 发表时间:
    2021-04
  • 期刊:
  • 影响因子:
    0.5
  • 作者:
    Yu Han;Chunming Zhang
  • 通讯作者:
    Yu Han;Chunming Zhang
Assessment of Projection Pursuit Index for Classifying High Dimension Low Sample Size Data in R
R 中高维低样本量数据分类的投影追踪指数评估
  • DOI:
    10.6339/23-jds1096
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Wu, Zhaoxing;Zhang, Chunming
  • 通讯作者:
    Zhang, Chunming
Further Examples Related to Correlations Between Variables and Ranks
与变量和排名之间的相关性相关的更多示例
  • DOI:
    10.1080/00031305.2020.1831956
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Zhang, Chunming
  • 通讯作者:
    Zhang, Chunming
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Chunming Zhang其他文献

Nd0.5Sr0.5Fe0.8Cu0.2O3?dexSm0.2Ce0.8O1.9cobalt-free composite cathodes for intermediate temperature solid oxide fuel cells
用于中温固体氧化物燃料电池的Nd0.5Sr0.5Fe0.8Cu0.2O3·dexSm0.2Ce0.8O1.9无钴复合阴极
Prediction Error Estimation Under Bregman Divergence for Non‐Parametric Regression and Classification
  • DOI:
    10.1111/j.1467-9469.2008.00593.x
  • 发表时间:
    2008-09
  • 期刊:
  • 影响因子:
    1
  • 作者:
    Chunming Zhang
  • 通讯作者:
    Chunming Zhang
Estimation of false discovery proportion in multiple testing: From normal to chi-squared test statistics
多重测试中错误发现比例的估计:从正态检验统计到卡方检验统计
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Lilun Du;Chunming Zhang
  • 通讯作者:
    Chunming Zhang
A 20Gbps CTLE with Active Inductor
具有有源电感器的 20Gbps CTLE
Assessing the equivalence of nonparametric regression tests based on spline and local polynomial smoothers

Chunming Zhang的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Chunming Zhang', 18)}}的其他基金

Statistical Inference for Large-Scale Structured Data with Dependence and Non-Stationarity
具有相关性和非平稳性的大规模结构化数据的统计推断
  • 批准号:
    1712418
  • 财政年份:
    2017
  • 资助金额:
    $ 12万
  • 项目类别:
    Continuing Grant
Collaborative Research: Novel and Unified Statistical Learning Procedures for Massive Dynamic Multiple-Input, Multiple-Output Networks
协作研究:大规模动态多输入多输出网络的新颖且统一的统计学习程序
  • 批准号:
    1521761
  • 财政年份:
    2015
  • 资助金额:
    $ 12万
  • 项目类别:
    Continuing Grant
Structural-Information Enhanced Inference for Large-Scale and High-Dimensional Data
大规模高维数据的结构信息增强推理
  • 批准号:
    1308872
  • 财政年份:
    2013
  • 资助金额:
    $ 12万
  • 项目类别:
    Standard Grant
Dimension Reduction for Non-Regular Statistical Models with Applications
非正则统计模型降维及其应用
  • 批准号:
    1106586
  • 财政年份:
    2011
  • 资助金额:
    $ 12万
  • 项目类别:
    Standard Grant
Regularization and Optimization for High Dimensional Regression and Classification with Biological Applications
生物应用中高维回归和分类的正则化和优化
  • 批准号:
    0705209
  • 财政年份:
    2007
  • 资助金额:
    $ 12万
  • 项目类别:
    Standard Grant
Collaborative Research: FRG: New development on nonparametric modeling and inferences with biological applications
合作研究:FRG:非参数建模和生物学应用推论的新进展
  • 批准号:
    0353941
  • 财政年份:
    2004
  • 资助金额:
    $ 12万
  • 项目类别:
    Standard Grant

相似国自然基金

Scalable Learning and Optimization: High-dimensional Models and Online Decision-Making Strategies for Big Data Analysis
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    万元
  • 项目类别:
    合作创新研究团队
Understanding structural evolution of galaxies with machine learning
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
煤矿安全人机混合群智感知任务的约束动态多目标Q-learning进化分配
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于领弹失效考量的智能弹药编队短时在线Q-learning协同控制机理
  • 批准号:
    62003314
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
集成上下文张量分解的e-learning资源推荐方法研究
  • 批准号:
    61902016
  • 批准年份:
    2019
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
具有时序迁移能力的Spiking-Transfer learning (脉冲-迁移学习)方法研究
  • 批准号:
    61806040
  • 批准年份:
    2018
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
基于Deep-learning的三江源区冰川监测动态识别技术研究
  • 批准号:
    51769027
  • 批准年份:
    2017
  • 资助金额:
    38.0 万元
  • 项目类别:
    地区科学基金项目
具有时序处理能力的Spiking-Deep Learning(脉冲深度学习)方法研究
  • 批准号:
    61573081
  • 批准年份:
    2015
  • 资助金额:
    64.0 万元
  • 项目类别:
    面上项目
基于有向超图的大型个性化e-learning学习过程模型的自动生成与优化
  • 批准号:
    61572533
  • 批准年份:
    2015
  • 资助金额:
    66.0 万元
  • 项目类别:
    面上项目
E-Learning中学习者情感补偿方法的研究
  • 批准号:
    61402392
  • 批准年份:
    2014
  • 资助金额:
    26.0 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Structural statistical learning of heterogeneous preferences for smart energy choices with a case study on coordinated electric vehicle charging
智能能源选择异构偏好的结构统计学习以及协调电动汽车充电的案例研究
  • 批准号:
    2342215
  • 财政年份:
    2024
  • 资助金额:
    $ 12万
  • 项目类别:
    Continuing Grant
CAREER: New Frameworks for Ethical Statistical Learning: Algorithmic Fairness and Privacy
职业:道德统计学习的新框架:算法公平性和隐私
  • 批准号:
    2340241
  • 财政年份:
    2024
  • 资助金额:
    $ 12万
  • 项目类别:
    Continuing Grant
Comparison of Machine Learning and Conventional Statistical Modeling for Predicting Readmission Following Acute Heart Failure Hospitalization
机器学习与传统统计模型预测急性心力衰竭住院后再入院的比较
  • 批准号:
    495410
  • 财政年份:
    2023
  • 资助金额:
    $ 12万
  • 项目类别:
Modern Statistics and Statistical Machine Learning
现代统计学和统计机器学习
  • 批准号:
    2886365
  • 财政年份:
    2023
  • 资助金额:
    $ 12万
  • 项目类别:
    Studentship
Modern Statistics and Statistical Machine Learning
现代统计学和统计机器学习
  • 批准号:
    2886852
  • 财政年份:
    2023
  • 资助金额:
    $ 12万
  • 项目类别:
    Studentship
EAGER: SSMCDAT2023: Revealing Local Symmetry Breaking in Intermetallics: Combining Statistical Mechanics and Machine Learning in PDF Analysis
EAGER:SSMCDAT2023:揭示金属间化合物中的局部对称性破缺:在 PDF 分析中结合统计力学和机器学习
  • 批准号:
    2334261
  • 财政年份:
    2023
  • 资助金额:
    $ 12万
  • 项目类别:
    Standard Grant
REU Site: University of North Carolina at Greensboro - Complex Data Analysis using Statistical and Machine Learning Tools
REU 站点:北卡罗来纳大学格林斯伯勒分校 - 使用统计和机器学习工具进行复杂数据分析
  • 批准号:
    2244160
  • 财政年份:
    2023
  • 资助金额:
    $ 12万
  • 项目类别:
    Standard Grant
Next-Generation Algorithms in Statistical Genetics Based on Modern Machine Learning
基于现代机器学习的下一代统计遗传学算法
  • 批准号:
    10714930
  • 财政年份:
    2023
  • 资助金额:
    $ 12万
  • 项目类别:
Bayesian Statistical Learning for Robust and Generalizable Causal Inferences in Alzheimer Disease and Related Disorders Research
贝叶斯统计学习在阿尔茨海默病和相关疾病研究中进行稳健且可推广的因果推论
  • 批准号:
    10590913
  • 财政年份:
    2023
  • 资助金额:
    $ 12万
  • 项目类别:
Unravel machine learning blackboxes -- A general, effective and performance-guaranteed statistical framework for complex and irregular inference problems in data science
揭开机器学习黑匣子——针对数据科学中复杂和不规则推理问题的通用、有效和性能有保证的统计框架
  • 批准号:
    2311064
  • 财政年份:
    2023
  • 资助金额:
    $ 12万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了