Statistical and Computational Aspects of Geometry- and Topology-Based Machine Learning
基于几何和拓扑的机器学习的统计和计算方面
基本信息
- 批准号:2053918
- 负责人:
- 金额:$ 32.41万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Continuing Grant
- 财政年份:2021
- 资助国家:美国
- 起止时间:2021-07-01 至 2024-06-30
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
As complex high-dimensional data is generated at a large-scale across a wide variety of scientific fields, exploratory data analysis is crucial to gain a better understanding about the data generating process. Indeed, the primary step in the data analysis pipeline arguably is to use unsupervised machine learning methods that help the data analyst to effectively visualize and understand the data being analyzed. This project will concentrate on developing a deeper understanding of such methods so as to enable interpreting the outputs of such procedures better. The novel methodology developed in this project will be disseminated to the applied fields based on existing collaborations of the PIs. Implementations of the developed methodologies will be made available for use by the wider public via open-source packages. This project will also train graduate students and undergraduate students (from socio-economically disadvantaged backgrounds) for a successful career in statistical data science. More specifically, the main goal of this project is to develop statistical and computational methods to extract low-dimensional geometric and topological structure available in high-dimensional datasets. The contributions of this project will hence lie at the intersection of statistical machine learning, and geometric and topological data analysis. The PIs will work both on developing a deeper understanding of existing methodology via a geometric lens, and on proposing novel methodology for unsupervised machine learning based on a topological lens. In the first part, the PIs will study the reason for the emergence of a certain geometric orthogonal cone structures when constructing low-dimension embeddings of high-dimensional data, with non-linear dimension reduction techniques like kernel principal component analysis, diffusion maps, non-local method like ISOMAP and Local Linear Embedding (LLE), and topological methods like Uniform Manifold Approximation and Projection (UMAP). In the second part, the PIs will develop and analyze novel dimension reduction techniques that preserve the topological information available in high-dimensional data. Finally, the PIs will examine the use of topological regularization techniques for regression and classification, from a theoretical and methodological perspective.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
由于复杂的高维数据在各种科学领域中大规模生成,探索性数据分析对于更好地了解数据生成过程至关重要。事实上,数据分析管道的主要步骤可以说是使用无监督机器学习方法,帮助数据分析师有效地可视化和理解正在分析的数据。本项目将着重于加深对这些方法的理解,以便能够更好地解释这些程序的产出。在这个项目中开发的新方法将传播到应用领域的基础上现有的合作的PI。将通过开放源码软件包向广大公众提供所制定方法的执行情况。该项目还将培训研究生和本科生(来自社会经济弱势背景)在统计数据科学方面取得成功。更具体地说,该项目的主要目标是开发统计和计算方法,以提取高维数据集中可用的低维几何和拓扑结构。因此,该项目的贡献将位于统计机器学习以及几何和拓扑数据分析的交叉点。PI将通过几何透镜对现有方法进行更深入的理解,并提出基于拓扑透镜的无监督机器学习的新方法。在第一部分中,PI将研究在构造高维数据的低维嵌入时出现某种几何正交锥结构的原因,使用非线性降维技术如核主成分分析,扩散映射,非局部方法如ISOMAP和局部线性嵌入(LLE),以及拓扑方法如均匀流形近似和投影(UMAP)。在第二部分中,PI将开发和分析新的降维技术,保留高维数据中可用的拓扑信息。最后,PI将从理论和方法的角度研究拓扑正则化技术在回归和分类中的应用。该奖项反映了NSF的法定使命,并通过使用基金会的知识价值和更广泛的影响审查标准进行评估,被认为值得支持。
项目成果
期刊论文数量(3)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Stochastic Zeroth-Order Functional Constrained Optimization: Oracle Complexity and Applications
随机零阶函数约束优化:Oracle 复杂性和应用
- DOI:10.1287/ijoo.2022.0085
- 发表时间:2022
- 期刊:
- 影响因子:0
- 作者:Nguyen, Anthony;Balasubramanian, Krishnakumar
- 通讯作者:Balasubramanian, Krishnakumar
Stochastic Zeroth-Order Riemannian Derivative Estimation and Optimization
- DOI:10.1287/moor.2022.1302
- 发表时间:2022-09
- 期刊:
- 影响因子:0
- 作者:Jiaxiang Li;K. Balasubramanian;Shiqian Ma
- 通讯作者:Jiaxiang Li;K. Balasubramanian;Shiqian Ma
Topologically penalized regression on manifolds
- DOI:
- 发表时间:2021-10
- 期刊:
- 影响因子:0
- 作者:Olympio Hacquard;K. Balasubramanian;G. Blanchard;W. Polonik;Clément Levrard
- 通讯作者:Olympio Hacquard;K. Balasubramanian;G. Blanchard;W. Polonik;Clément Levrard
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Krishnakumar Balasubramanian其他文献
On the asymptotic risk of ridge regression with many predictors
- DOI:
10.1007/s13226-024-00646-9 - 发表时间:
2024-07-08 - 期刊:
- 影响因子:0.500
- 作者:
Krishnakumar Balasubramanian;Prabir Burman;Debashis Paul - 通讯作者:
Debashis Paul
Krishnakumar Balasubramanian的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
相似国自然基金
车载中央计算平台软件框架及泊车功能研发与产业化应用
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
基于低龄儿童头面部图像绘制形态表型图谱及遗传机制研究
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
肿瘤放疗过程中病灶演化的深度自回归模型研究
- 批准号:JCZRYB202501085
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
一维多项式系统的线性单量表示与计算
- 批准号:JCZRLH202500845
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
复杂粘弹性板振动模型的建模、分析、计算、最优传输与平均场控制问题
- 批准号:JCZRQN202500278
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
多模态数据可信流通关键技术研究
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
面向文化产业的数字人生成关键技术研究
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
电视三维文博馆数字建模及渲染关键技术
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
多学科交叉下的彩绘造像文物数字化复原及保护技术研究
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
基于跨境数据流动背景下的重庆城市形象多模态评估系统构建研究
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
相似海外基金
Dynamic treatment regimes via smooth surrogate loss: theory, methods, and computational aspects
通过平滑替代损失的动态治疗方案:理论、方法和计算方面
- 批准号:
2311098 - 财政年份:2023
- 资助金额:
$ 32.41万 - 项目类别:
Continuing Grant
Computational Aspects of Reasoning about Dynamic Systems
动态系统推理的计算方面
- 批准号:
RGPIN-2022-05453 - 财政年份:2022
- 资助金额:
$ 32.41万 - 项目类别:
Discovery Grants Program - Individual
Mathematical and computational aspects of solid mechanics
固体力学的数学和计算方面
- 批准号:
CRC-2021-00303 - 财政年份:2022
- 资助金额:
$ 32.41万 - 项目类别:
Canada Research Chairs
Computational and Combinatorial Aspects of Strings
字符串的计算和组合方面
- 批准号:
RGPIN-2018-05504 - 财政年份:2022
- 资助金额:
$ 32.41万 - 项目类别:
Discovery Grants Program - Individual
Computational and Combinatorial Aspects of Strings
字符串的计算和组合方面
- 批准号:
RGPIN-2018-05504 - 财政年份:2021
- 资助金额:
$ 32.41万 - 项目类别:
Discovery Grants Program - Individual
Computational Aspects of Deep Gaussian Processes in Data Science
数据科学中深度高斯过程的计算方面
- 批准号:
2616566 - 财政年份:2021
- 资助金额:
$ 32.41万 - 项目类别:
Studentship
Computational and Combinatorial Aspects of Strings
字符串的计算和组合方面
- 批准号:
RGPIN-2018-05504 - 财政年份:2020
- 资助金额:
$ 32.41万 - 项目类别:
Discovery Grants Program - Individual
Computational, Combinatorial, and Geometric Aspects of Linear Optimization
线性优化的计算、组合和几何方面
- 批准号:
RGPIN-2015-06163 - 财政年份:2019
- 资助金额:
$ 32.41万 - 项目类别:
Discovery Grants Program - Individual
Quantitative, Computational, and Stochastic Aspects of Topology
拓扑的定量、计算和随机方面
- 批准号:
1906516 - 财政年份:2019
- 资助金额:
$ 32.41万 - 项目类别:
Standard Grant
Computational Modeling of Stylistic Aspects of Dialogue Utterances
对话话语文体方面的计算建模
- 批准号:
19J21913 - 财政年份:2019
- 资助金额:
$ 32.41万 - 项目类别:
Grant-in-Aid for JSPS Fellows