Statistical Models and Methods for Complex Data in Metric Spaces

度量空间中复杂数据的统计模型和方法

基本信息

  • 批准号:
    2310450
  • 负责人:
  • 金额:
    $ 33.58万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2023
  • 资助国家:
    美国
  • 起止时间:
    2023-07-01 至 2026-06-30
  • 项目状态:
    未结题

项目摘要

Big data in the form of random objects are increasingly encountered across sciences and society. Adequate and principled approaches for their analysis are important to extract relevant information, to make predictions, and to assess whether there are differences between samples. However, the complexity of such data poses major challenges for statistical analysis and traditional methods cannot be applied. In this project, these challenges will be addressed and overcome through the development of advanced nonparametric statistical methodology that can handle the complexity of object data. Specific objects that will be studied include networks and distributions, with applications for brain imaging and genomics data, climate change data and data from other areas of current interest. For situations where random objects are repeatedly observed over time, such as repeatedly observed MRI brain scans for the same subject, quantifications of the underlying time dynamics will also be developed. The research will include methods for testing and estimation, theory, efficient computational implementation, and data applications, which are expected to lead to substantial new insights. The project will provide training for the next generation of data analysts and research statisticians and user-friendly code implementing the methods will be made available. The project will contribute to the foundations of the emerging field of metric statistics as a comprehensive framework for statistical methodology and theory for samples of random objects, which are random variables/data that take values in a metric space. Random objects encompass data in the form of distributions, networks, trees, covariance matrices and surfaces, and data on Riemannian manifolds such as spheres. The statistical analysis of such data is challenging as one cannot apply traditional statistical methods due to the absence of a vector space structure. Specifically, for random objects that are situated in a geodesic space, a general class of regression models for transports from the barycenter to specific objects will be developed. In these models both predictors and responses are transports and specific examples are regression models for spherical data and distributions. The project will also include the study of regression models for multivariate distributions as responses, paired with Euclidean predictors, using slice-optimization in Wasserstein space. This approach will be illustrated with applications in climatology and life sciences data. Another goal is the development of transport processes in a geodesic space, constituting a new type of stochastic process. For such processes, anchor point representations for general types of random objects and latent Gaussian process representations for distributional objects in Wasserstein space will be obtained. Additionally, a random effects model for Frechet regression will be developed, providing the first such model for longitudinal object data, with applications in brain imaging and distributional data analysis. Throughout, the challenges resulting from the absence of Euclidean and algebraic structures will be addressed with empirical process theory and other tools.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
随机对象形式的大数据越来越多地出现在科学和社会中。适当和有原则的分析方法对于提取相关信息、进行预测和评估样本之间是否存在差异非常重要。然而,这些数据的复杂性给统计分析带来了重大挑战,传统方法无法应用。 在这个项目中,这些挑战将通过开发先进的非参数统计方法来解决和克服,这些方法可以处理对象数据的复杂性。 将研究的具体对象包括网络和分布,以及脑成像和基因组学数据、气候变化数据和当前感兴趣的其他领域的数据的应用。对于随着时间的推移重复观察随机对象的情况,例如重复观察同一受试者的MRI脑部扫描,还将开发潜在时间动态的量化。该研究将包括测试和估计方法,理论,有效的计算实现和数据应用,预计将导致大量的新见解。该项目将为下一代数据分析员和研究统计员提供培训,并将提供便于用户使用的代码来执行这些方法。 该项目将为新兴的度量统计领域奠定基础,作为随机对象样本的统计方法和理论的综合框架,随机对象是在度量空间中取值的随机变量/数据。随机对象包括分布、网络、树、协方差矩阵和曲面形式的数据,以及黎曼流形(如球面)上的数据。对这些数据的统计分析是具有挑战性的,因为由于缺乏向量空间结构,人们无法应用传统的统计方法。 具体而言,对于位于测地线空间中的随机对象,将开发从重心到特定对象的一般类回归模型。在这些模型中,预测因子和响应都是传输,具体示例是球形数据和分布的回归模型。该项目还将包括研究多元分布的回归模型作为响应,与欧几里德预测因子配对,使用Wasserstein空间中的切片优化。这一方法将在气候学和生命科学数据中得到应用。另一个目标是在测地空间中发展运输过程,构成一种新型的随机过程。对于这样的过程,一般类型的随机对象的锚点表示和Wasserstein空间中的分布对象的潜高斯过程表示将被获得。 此外,还将开发一个用于Frechet回归的随机效应模型,为纵向对象数据提供第一个此类模型,并应用于脑成像和分布数据分析。 在整个过程中,由于缺乏欧几里德和代数结构而产生的挑战将通过经验过程理论和其他工具来解决。该奖项反映了NSF的法定使命,并被认为值得通过使用基金会的智力价值和更广泛的影响审查标准进行评估来支持。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Hans-Georg Mueller其他文献

Hans-Georg Mueller的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Hans-Georg Mueller', 18)}}的其他基金

Models for Complex Functional and Object Data
复杂功能和对象数据的模型
  • 批准号:
    2014626
  • 财政年份:
    2020
  • 资助金额:
    $ 33.58万
  • 项目类别:
    Standard Grant
From Functional Data to Random Objects
从功能数据到随机对象
  • 批准号:
    1712864
  • 财政年份:
    2017
  • 资助金额:
    $ 33.58万
  • 项目类别:
    Continuing Grant
Modeling Complex Functional Data
复杂功能数据建模
  • 批准号:
    1407852
  • 财政年份:
    2014
  • 资助金额:
    $ 33.58万
  • 项目类别:
    Standard Grant
Statistical Representations and Algorithms for Brain Connectivity
大脑连接的统计表示和算法
  • 批准号:
    1228369
  • 财政年份:
    2012
  • 资助金额:
    $ 33.58万
  • 项目类别:
    Standard Grant
Nonlinear Models for Functional Data Analysis
函数数据分析的非线性模型
  • 批准号:
    1104426
  • 财政年份:
    2011
  • 资助金额:
    $ 33.58万
  • 项目类别:
    Continuing Grant
Functional Models for Complex and High-Dimensional Data
复杂和高维数据的函数模型
  • 批准号:
    0806199
  • 财政年份:
    2008
  • 资助金额:
    $ 33.58万
  • 项目类别:
    Continuing Grant
Nonparametric Methods for Functional Data
函数数据的非参数方法
  • 批准号:
    0505537
  • 财政年份:
    2005
  • 资助金额:
    $ 33.58万
  • 项目类别:
    Continuing Grant
Collaborative Research: FRG: New Development on Nonparametric Modeling and Inferences with Biological Applications
合作研究:FRG:非参数建模和生物学应用推论的新进展
  • 批准号:
    0354448
  • 财政年份:
    2004
  • 资助金额:
    $ 33.58万
  • 项目类别:
    Standard Grant
Nonparametric and Semiparametric Models for High-Dimensional Data
高维数据的非参数和半参数模型
  • 批准号:
    0204869
  • 财政年份:
    2002
  • 资助金额:
    $ 33.58万
  • 项目类别:
    Standard Grant
Nonparametric and Semiparametric Modelling for Data Analysis
数据分析的非参数和半参数建模
  • 批准号:
    9971602
  • 财政年份:
    1999
  • 资助金额:
    $ 33.58万
  • 项目类别:
    Continuing Grant

相似国自然基金

基于广义加性模型的组学数据批次效应校正方法及应用
  • 批准号:
    JCZRYB202500058
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
作物数量性状全基因组选择新方法及其应用研究
  • 批准号:
    D25C130003
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
几类大数据整体统计推断方法与理论研究
  • 批准号:
    Y24A010038
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
城市高时空分辨率碳排放的反演方法、驱动机 制与减排路径研究
  • 批准号:
    TGS24D010016
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
多粒度概率回归建模理论与方法
  • 批准号:
    2024JJ4069
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
面向数据异质的个性化模型学习及聚合方法研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    15.0 万元
  • 项目类别:
    省市级项目
基于高通量测序的表观遗传学数据的统计方法研究
  • 批准号:
    24ZR1456400
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
缺失数据下模型平均方法的研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
动态形变统计模型驱动的小样本腹部CT多器官分割方法研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
函数型异方差模型的非线性构建方法及统计推断
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    万元
  • 项目类别:
    青年科学基金项目

相似海外基金

CAREER: Statistical Models and Parallel-computing Methods for Analyzing Sparse and Large Single-cell Chromatin Interaction Datasets
职业:用于分析稀疏和大型单细胞染色质相互作用数据集的统计模型和并行计算方法
  • 批准号:
    2239350
  • 财政年份:
    2023
  • 资助金额:
    $ 33.58万
  • 项目类别:
    Continuing Grant
Statistical models and methods for survival and longitudinal data in clinical and observational studies
临床和观察研究中生存和纵向数据的统计模型和方法
  • 批准号:
    RGPIN-2018-05197
  • 财政年份:
    2022
  • 资助金额:
    $ 33.58万
  • 项目类别:
    Discovery Grants Program - Individual
Efficient Statistical and Computational Methods for Genetics and Dynamical Models
遗传学和动力学模型的高效统计和计算方法
  • 批准号:
    RGPIN-2019-06131
  • 财政年份:
    2022
  • 资助金额:
    $ 33.58万
  • 项目类别:
    Discovery Grants Program - Individual
Computational and statistical methods for loss models
损失模型的计算和统计方法
  • 批准号:
    RGPIN-2017-06643
  • 财政年份:
    2022
  • 资助金额:
    $ 33.58万
  • 项目类别:
    Discovery Grants Program - Individual
Models and methods of statistical dependence with applications in clinical trials and risk management
统计依赖性模型和方法及其在临床试验和风险管理中的应用
  • 批准号:
    RGPIN-2018-05362
  • 财政年份:
    2022
  • 资助金额:
    $ 33.58万
  • 项目类别:
    Discovery Grants Program - Individual
Algebraic methods for lattice models of statistical physics
统计物理晶格模型的代数方法
  • 批准号:
    RGPIN-2019-05450
  • 财政年份:
    2022
  • 资助金额:
    $ 33.58万
  • 项目类别:
    Discovery Grants Program - Individual
Computational and statistical methods for loss models
损失模型的计算和统计方法
  • 批准号:
    RGPIN-2017-06643
  • 财政年份:
    2021
  • 资助金额:
    $ 33.58万
  • 项目类别:
    Discovery Grants Program - Individual
Algebraic methods for lattice models of statistical physics
统计物理晶格模型的代数方法
  • 批准号:
    RGPIN-2019-05450
  • 财政年份:
    2021
  • 资助金额:
    $ 33.58万
  • 项目类别:
    Discovery Grants Program - Individual
Models and methods of statistical dependence with applications in clinical trials and risk management
统计依赖性模型和方法及其在临床试验和风险管理中的应用
  • 批准号:
    RGPIN-2018-05362
  • 财政年份:
    2021
  • 资助金额:
    $ 33.58万
  • 项目类别:
    Discovery Grants Program - Individual
Statistical models and methods for survival and longitudinal data in clinical and observational studies
临床和观察研究中生存和纵向数据的统计模型和方法
  • 批准号:
    RGPIN-2018-05197
  • 财政年份:
    2021
  • 资助金额:
    $ 33.58万
  • 项目类别:
    Discovery Grants Program - Individual
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了