CAREER: Learning of graph diffusion and transport from high dimensional data with low-dimensional structures

职业:从具有低维结构的高维数据中学习图扩散和传输

基本信息

  • 批准号:
    2237842
  • 负责人:
  • 金额:
    $ 42.38万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Continuing Grant
  • 财政年份:
    2023
  • 资助国家:
    美国
  • 起止时间:
    2023-09-01 至 2028-08-31
  • 项目状态:
    未结题

项目摘要

Graph-based methods are pivotal tools in big data analysis due to their powerful ability to model data in various fields of science and industry. For high-dimensional data, an affinity graph can be constructed from the data cloud and the graph geometry will recover the implicit low-dimensional structure of the data. Therefore, a graph-based approach has the potential to overcome the curse of dimensionality and provide distribution-free methods for predictive and generative learning tasks. The overarching goal of this project is to develop a theoretical and computational framework for graph-based data analysis that overcomes the curse of dimensionality of high dimensional data by leveraging the underlying low-dimensional geometric structure in the data. The mathematical results can be applied to data visualization and dimension reduction, generative models, general unsupervised learning, and a wide range of real applications, ranging from single-cell sequencing to sensor networks. The project will provide research opportunities and projects that are suitable for graduate and undergraduate students, and results of the project will produce pedagogical materials to be incorporated into data science courses at the undergraduate and graduate levels. The project aims to develop theoretical and computational tools for efficient and accurate graph-based analysis of high-dimensional data that captures the intrinsically low-dimensional, non-linear structures in the data. The research work consists of four integrated topics: (1) learning of graph diffusion with a theoretical guarantee, (2) robust graph affinity for graph-based data analysis, (3) graph-based learning of intrinsic optimal transport in high dimension, and (4) generative model of graph data by gradient flow. Using tools from applied harmonic analysis and high dimensional probability, the project will address several open questions in the field. On the theoretical side, the project will model the implicit low-dimensional structure as data lying on or near hidden manifolds embedded in the high-dimensional space and analyze the convergence of the graph operators in the limit of large samples. On the practical side, the project will develop algorithms with sampling and computational complexities only depending on the intrinsic data dimensionality. The mathematical findings will provide computational tools to analyze data in real world applications, including biomedical and network data.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
基于图的方法是大数据分析的关键工具,因为它具有强大的能力,可以在科学和工业的各个领域对数据进行建模。对于高维数据,可以从数据云构造一个关联图,图形几何将恢复数据的隐式低维结构。因此,基于图的方法有可能克服维数的诅咒,并为预测和生成学习任务提供无分布的方法。该项目的总体目标是为基于图的数据分析开发一个理论和计算框架,通过利用数据中潜在的低维几何结构来克服高维数据的维数诅咒。数学结果可以应用于数据可视化和降维,生成模型,一般无监督学习,以及广泛的实际应用,从单细胞测序到传感器网络。该项目将提供适合研究生和本科生的研究机会和项目,项目的结果将制作教学材料,纳入本科和研究生水平的数据科学课程。该项目旨在开发理论和计算工具,以有效和准确地对高维数据进行基于图形的分析,从而捕获数据中本质上低维的非线性结构。研究工作包括四个综合主题:(1)具有理论保证的图扩散学习;(2)基于图的数据分析的鲁棒图亲和力学习;(3)基于图的高维内在最优运输学习;(4)梯度流的图数据生成模型。利用应用谐波分析和高维概率的工具,该项目将解决该领域的几个开放问题。在理论方面,该项目将隐式低维结构建模为嵌入在高维空间中的隐藏流形上或附近的数据,并分析图算子在大样本极限下的收敛性。在实际方面,该项目将开发具有采样和计算复杂性的算法,仅取决于内在数据维度。数学发现将提供计算工具来分析现实世界中的数据应用,包括生物医学和网络数据。该奖项反映了美国国家科学基金会的法定使命,并通过使用基金会的知识价值和更广泛的影响审查标准进行评估,被认为值得支持。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Xiuyuan Cheng其他文献

Cluster-independent multiscale marker identification in single-cell RNA-seq data using localized marker detector (LMD)
使用局部标记检测器(LMD)在单细胞 RNA-seq 数据中进行独立于聚类的多尺度标记识别
  • DOI:
    10.1038/s42003-025-08485-y
  • 发表时间:
    2025-07-16
  • 期刊:
  • 影响因子:
    5.100
  • 作者:
    Ruiqi Li;Rihao Qu;Fabio Parisi;Francesco Strino;Hainan Lam;Jay S. Stanley;Xiuyuan Cheng;Peggy Myung;Yuval Kluger
  • 通讯作者:
    Yuval Kluger
Police Text Analysis: Topic Modeling and Spatial Relative Density Estimation
警察文本分析:主题建模和空间相对密度估计
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Sarah Huestis;Xiuyuan Cheng;Yao Xie
  • 通讯作者:
    Yao Xie
The emG/em-invariant graph Laplacian Part I: Convergence rate and eigendecomposition
emG/em-不变图拉普拉斯算子第一部分:收敛速度和特征分解
  • DOI:
    10.1016/j.acha.2024.101637
  • 发表时间:
    2024-07-01
  • 期刊:
  • 影响因子:
    3.200
  • 作者:
    Eitan Rosen;Paulina Hoyos;Xiuyuan Cheng;Joe Kileel;Yoel Shkolnisky
  • 通讯作者:
    Yoel Shkolnisky
Bi-stochastically normalized graph Laplacian: convergence to manifold Laplacian and robustness to outlier noise
双随机归一化图拉普拉斯:收敛于流形拉普拉斯算子以及对异常噪声的鲁棒性
  • DOI:
    10.48550/arxiv.2206.11386
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Xiuyuan Cheng;Boris Landa
  • 通讯作者:
    Boris Landa
The emG/em-invariant graph Laplacian part II: Diffusion maps
emG/em-不变图拉普拉斯算子第二部分:扩散映射

Xiuyuan Cheng的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Xiuyuan Cheng', 18)}}的其他基金

NSF-BSF: Group Invariant Graph Laplacians: Theory and Computations
NSF-BSF:群不变图拉普拉斯算子:理论与计算
  • 批准号:
    2007040
  • 财政年份:
    2020
  • 资助金额:
    $ 42.38万
  • 项目类别:
    Continuing Grant
CDS&E: Structure-Aware Representation Learning Using Deep Networks
CDS
  • 批准号:
    1820827
  • 财政年份:
    2018
  • 资助金额:
    $ 42.38万
  • 项目类别:
    Continuing Grant
Collaborative Research: Geometric Analysis and Computation for Generative Models
协作研究:生成模型的几何分析和计算
  • 批准号:
    1818945
  • 财政年份:
    2018
  • 资助金额:
    $ 42.38万
  • 项目类别:
    Standard Grant

相似国自然基金

Scalable Learning and Optimization: High-dimensional Models and Online Decision-Making Strategies for Big Data Analysis
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    万元
  • 项目类别:
    合作创新研究团队
Understanding structural evolution of galaxies with machine learning
  • 批准号:
    n/a
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
煤矿安全人机混合群智感知任务的约束动态多目标Q-learning进化分配
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于领弹失效考量的智能弹药编队短时在线Q-learning协同控制机理
  • 批准号:
    62003314
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
集成上下文张量分解的e-learning资源推荐方法研究
  • 批准号:
    61902016
  • 批准年份:
    2019
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
具有时序迁移能力的Spiking-Transfer learning (脉冲-迁移学习)方法研究
  • 批准号:
    61806040
  • 批准年份:
    2018
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
基于Deep-learning的三江源区冰川监测动态识别技术研究
  • 批准号:
    51769027
  • 批准年份:
    2017
  • 资助金额:
    38.0 万元
  • 项目类别:
    地区科学基金项目
具有时序处理能力的Spiking-Deep Learning(脉冲深度学习)方法研究
  • 批准号:
    61573081
  • 批准年份:
    2015
  • 资助金额:
    64.0 万元
  • 项目类别:
    面上项目
基于有向超图的大型个性化e-learning学习过程模型的自动生成与优化
  • 批准号:
    61572533
  • 批准年份:
    2015
  • 资助金额:
    66.0 万元
  • 项目类别:
    面上项目
E-Learning中学习者情感补偿方法的研究
  • 批准号:
    61402392
  • 批准年份:
    2014
  • 资助金额:
    26.0 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

CAREER: Strategic Interactions, Learning, and Dynamics in Large-Scale Multi-Agent Systems: Achieving Tractability via Graph Limits
职业:大规模多智能体系统中的战略交互、学习和动态:通过图限制实现可处理性
  • 批准号:
    2340289
  • 财政年份:
    2024
  • 资助金额:
    $ 42.38万
  • 项目类别:
    Continuing Grant
CAREER: Algorithm-Hardware Co-design of Efficient Large Graph Machine Learning for Electronic Design Automation
职业:用于电子设计自动化的高效大图机器学习的算法-硬件协同设计
  • 批准号:
    2340273
  • 财政年份:
    2024
  • 资助金额:
    $ 42.38万
  • 项目类别:
    Continuing Grant
CAREER: Physics-informed Graph Learning for Anomaly Detection in Power Systems
职业:用于电力系统异常检测的物理信息图学习
  • 批准号:
    2338642
  • 财政年份:
    2024
  • 资助金额:
    $ 42.38万
  • 项目类别:
    Continuing Grant
CAREER: Integrating Graph Theory based Networks with Machine Learning for Enhanced Process Synthesis and Design
职业:将基于图论的网络与机器学习相集成以增强流程综合和设计
  • 批准号:
    2339588
  • 财政年份:
    2024
  • 资助金额:
    $ 42.38万
  • 项目类别:
    Continuing Grant
CAREER: Learning Power System Graph Signals for Cascade Resiliency
职业:学习电力系统图形信号以实现级联弹性
  • 批准号:
    2238658
  • 财政年份:
    2023
  • 资助金额:
    $ 42.38万
  • 项目类别:
    Continuing Grant
CAREER: Reeb graph learning: Classification, Clustering, and Embedding of Graphical Signatures
职业:Reeb 图学习:图形签名的分类、聚类和嵌入
  • 批准号:
    2142713
  • 财政年份:
    2022
  • 资助金额:
    $ 42.38万
  • 项目类别:
    Continuing Grant
CAREER: Reinforced Imitative Graph Learning: Bridging the Gap between Perception and Prescription in Graph Sequences
职业:强化模仿图学习:弥合图序列中感知和规定之间的差距
  • 批准号:
    2045567
  • 财政年份:
    2021
  • 资助金额:
    $ 42.38万
  • 项目类别:
    Continuing Grant
CAREER: Advances in Graph Learning and Inference
职业:图学习和推理的进展
  • 批准号:
    2005804
  • 财政年份:
    2019
  • 资助金额:
    $ 42.38万
  • 项目类别:
    Continuing Grant
CAREER: Advances in Graph Learning and Inference
职业:图学习和推理的进展
  • 批准号:
    1750920
  • 财政年份:
    2018
  • 资助金额:
    $ 42.38万
  • 项目类别:
    Continuing Grant
CAREER: Statistical Learning from Data with Graph/Network Structures
职业:从具有图/网络结构的数据中进行统计学习
  • 批准号:
    0748389
  • 财政年份:
    2008
  • 资助金额:
    $ 42.38万
  • 项目类别:
    Continuing Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了