Multiscale Generalized Correlation: A Unified Distance-Based Correlation Measure for Dependency Discovery

多尺度广义相关性:用于依赖性发现的统一的基于距离的相关性测量

基本信息

  • 批准号:
    1712947
  • 负责人:
  • 金额:
    $ 20万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Continuing Grant
  • 财政年份:
    2017
  • 资助国家:
    美国
  • 起止时间:
    2017-07-01 至 2019-03-31
  • 项目状态:
    已结题

项目摘要

Detecting relationships between two data sets has long been one of the most important questions in statistics and is fundamental to scientific discovery in the big-data era. By developing an open-source, robust, efficient, and scalable statistical methodology for testing dependence on modern data, this project aims to advance the understanding and utility of testing dependence, tackle a number of related statistical inference questions, and accelerate a broad range of data-intensive research. The project incorporates fundamental research in mathematics, statistics, and computer science to further develop a multiscale generalized correlation framework to enable discovery and decision-making via analysis of large and complex data. The tools under development will allow scientists to better explore and understand high-dimensional, nonlinear, and multi-modal data in a myriad of applications. The project aims to provide a unified framework for discovery of relationships between observations in an efficient and theoretically-sound manner. Combining the notion of generalized correlation with the locality principle, multiscale generalized correlation (MGC) is a superior correlation measure that equals the optimal local correlation among all possible local scales. By building upon distance correlation and making use of nearest neighbors, the resulting MGC test statistic is a unique dependence measure that is consistent for testing against all dependencies with finite second moment, and it exhibits better performance than existing state-of-art methods under a wide variety of nonlinear and high-dimensional dependencies. By investigating the theoretical aspects of distance-based correlations, this project aims to further improve the finite-sample performance of MGC-style tests, extend its capability to testing dependence on network and kernel data, and broaden its utility to general inferential questions beyond dependence testing such as two-sample testing, outlier detection, and feature screening, as well as applications to brain activity, networks, and text analysis. Overall, this project intends to establish a unified methodology framework for statistical testing in high-dimensional, noisy, big data, through theoretical advancements, comprehensive simulations, and real data experiments.
长期以来,检测两个数据集之间的关系一直是统计学中最重要的问题之一,也是大数据时代科学发现的基础。通过开发一种开源的,强大的,高效的和可扩展的统计方法来测试对现代数据的依赖性,该项目旨在促进对测试依赖性的理解和实用性,解决一些相关的统计推断问题,并加速广泛的数据密集型研究。该项目结合了数学,统计学和计算机科学的基础研究,以进一步开发多尺度广义相关框架,通过分析大型复杂数据进行发现和决策。正在开发的工具将使科学家能够更好地探索和理解无数应用中的高维,非线性和多模态数据。该项目旨在提供一个统一的框架,以有效和理论合理的方式发现观测之间的关系。多尺度广义相关性(MGC)是广义相关性的概念与局部性原理的结合,是一种上级相关性度量,它等于所有可能的局部尺度之间的最优局部相关性。通过建立在距离相关性和利用最近邻,产生的MGC测试统计量是一个独特的依赖性措施,是一致的测试对所有的依赖与有限的二阶矩,它表现出更好的性能比现有的国家的最先进的方法在各种各样的非线性和高维的依赖。通过研究基于距离的相关性的理论方面,该项目旨在进一步提高MGC风格测试的有限样本性能,将其能力扩展到测试对网络和内核数据的依赖性,并将其实用性扩展到依赖性测试之外的一般推理问题,如双样本测试,离群值检测和特征筛选,以及大脑活动,网络和文本分析的应用。总体而言,该项目旨在通过理论进步,综合模拟和真实的数据实验,建立一个统一的方法框架,用于高维,噪声,大数据的统计测试。

项目成果

期刊论文数量(2)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Discovering and deciphering relationships across disparate data modalities
  • DOI:
    10.7554/elife.41690
  • 发表时间:
    2019-01-15
  • 期刊:
  • 影响因子:
    7.7
  • 作者:
    Vogelstein, Joshua T.;Bridgeford, Eric W.;Shen, Cencheng
  • 通讯作者:
    Shen, Cencheng
From Distance Correlation to Multiscale Graph Correlation
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Cencheng Shen其他文献

Graph Encoder Ensemble for Simultaneous Vertex Embedding and Community Detection
用于同时顶点嵌入和社区检测的图编码器集成
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Cencheng Shen;Youngser Park;C. Priebe
  • 通讯作者:
    C. Priebe
hyppo: A Comprehensive Multivariate Hypothesis Testing Python Package
hyppo:全面的多元假设检验 Python 包
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Sambit Panda;S. Palaniappan;Junhao Xiong;Eric W. Bridgeford;Ronak R. Mehta;Cencheng Shen;J. Vogelstein
  • 通讯作者:
    J. Vogelstein
Efficient Graph Encoder Embedding for Large Sparse Graphs in Python
Python 中大型稀疏图的高效图编码器嵌入
  • DOI:
  • 发表时间:
    2024
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Xihan Qin;Cencheng Shen
  • 通讯作者:
    Cencheng Shen
Discovering Relationships Across Disparate Data Modalities
发现不同数据模式之间的关系
  • DOI:
  • 发表时间:
    2016
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Cencheng Shen;C. Priebe;M. Maggioni;J. Vogelstein
  • 通讯作者:
    J. Vogelstein
On the Incommensurability Phenomenon
  • DOI:
    10.1007/s00357-016-9203-9
  • 发表时间:
    2016-07-21
  • 期刊:
  • 影响因子:
    1.900
  • 作者:
    Donniell E. Fishkind;Cencheng Shen;Youngser Park;Carey E. Priebe
  • 通讯作者:
    Carey E. Priebe

Cencheng Shen的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Cencheng Shen', 18)}}的其他基金

Neural Net Learning for Graph Data
图数据的神经网络学习
  • 批准号:
    2113099
  • 财政年份:
    2021
  • 资助金额:
    $ 20万
  • 项目类别:
    Standard Grant
Multiscale Generalized Correlation: A Unified Distance-Based Correlation Measure for Dependency Discovery
多尺度广义相关性:用于依赖性发现的统一的基于距离的相关性测量
  • 批准号:
    1921310
  • 财政年份:
    2018
  • 资助金额:
    $ 20万
  • 项目类别:
    Continuing Grant

相似国自然基金

三维流形的Generalized Seifert Fiber分解
  • 批准号:
    11526046
  • 批准年份:
    2015
  • 资助金额:
    3.0 万元
  • 项目类别:
    数学天元基金项目

相似海外基金

Generalized deep unfoldingの提案と曖昧なドメイン知識モデリングへの応用
广义深度展开的提出及其在模糊领域知识建模中的应用
  • 批准号:
    24K03010
  • 财政年份:
    2024
  • 资助金额:
    $ 20万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Unique continuation and the regularity of elliptic PDEs and generalized minimal submanifolds
椭圆偏微分方程和广义最小子流形的唯一延拓和正则性
  • 批准号:
    2350351
  • 财政年份:
    2024
  • 资助金额:
    $ 20万
  • 项目类别:
    Standard Grant
Near Lossless Dense Light Field Compression Using Generalized Neural Radiance Field
使用广义神经辐射场的近无损密集光场压缩
  • 批准号:
    24K20797
  • 财政年份:
    2024
  • 资助金额:
    $ 20万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
Diagonal Grobner Geometry of Generalized Determinantal Varieties
广义行列式簇的对角格罗布纳几何
  • 批准号:
    2344764
  • 财政年份:
    2023
  • 资助金额:
    $ 20万
  • 项目类别:
    Standard Grant
Efficient Computation of Generalized Persistence Diagrams
广义持久图的高效计算
  • 批准号:
    2324632
  • 财政年份:
    2023
  • 资助金额:
    $ 20万
  • 项目类别:
    Continuing Grant
Canonical Singularities, Generalized Symmetries, and 5d Superconformal Field Theories
正则奇点、广义对称性和 5d 超共形场论
  • 批准号:
    EP/X01276X/1
  • 财政年份:
    2023
  • 资助金额:
    $ 20万
  • 项目类别:
    Fellowship
New developments on quantum information analysis by a stochastic analysis based on theory of spaces consisting of generalized functionals
基于广义泛函空间理论的随机分析量子信息分析新进展
  • 批准号:
    23K03139
  • 财政年份:
    2023
  • 资助金额:
    $ 20万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Generalized prediction errors in the human cerebellum
人类小脑的广义预测误差
  • 批准号:
    10715334
  • 财政年份:
    2023
  • 资助金额:
    $ 20万
  • 项目类别:
Generalized Stochastic Nash Equilibrium Framework: Theory, Computation, and Application
广义随机纳什均衡框架:理论、计算和应用
  • 批准号:
    2231863
  • 财政年份:
    2023
  • 资助金额:
    $ 20万
  • 项目类别:
    Standard Grant
Testing generalized space-time geometry with multimessenger observations of gravitation al waves
用引力波的多信使观测测试广义时空几何
  • 批准号:
    22KF0085
  • 财政年份:
    2023
  • 资助金额:
    $ 20万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了