CAREER: AF: Giving Form to Data with a Geometric Scaffold

职业:AF:用几何支架赋予数据形式

基本信息

  • 批准号:
    1750780
  • 负责人:
  • 金额:
    $ 49.7万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Continuing Grant
  • 财政年份:
    2018
  • 资助国家:
    美国
  • 起止时间:
    2018-09-01 至 2024-08-31
  • 项目状态:
    已结题

项目摘要

Using geometry to find structure in data is an old idea (Plato is quoted as saying, "God ever geometrizes") that gains fresh application as our data changes. Today's data sets, from areas such as machine learning, are often massive and high-dimensional: for example, when trying to classify news articles, each article may be represented as a point where the frequency of each word is a different dimension. This leads to geometries that are hard to grasp intuitively and hard to work with computationally (the "curse of dimensionality"). Finding a smaller and lower dimensional subset of the data points that approximately preserves geometric structure not only reduces computation time but also can improve results by suppressing extraneous features. Representing inter-point distances of a general space in a more structured space can support new operations, such as data visualization by mapping the 2-D plane of the screen, or more efficient computation by mapping to the hierarchical structure of a tree. This project takes the age-old practice of teasing out geometric structure and applies it to the large- and high-dimensional data sets of the modern world. By taking a geometric approach to foundational problems in areas such as big data and machine learning, this project seeks to more closely connect computational geometry and these other areas, in turn both modernizing the classical field of computational geometry and advancing these other areas. The educational goals of this project will be achieved by directly supporting student research on the outlined topics, incorporating topics into developing new courses, and organizing regular seminars in order to grow the visibility and interdisciplinary nature of algorithms and theoretical computer science at the awardee institution.Given a data set, the goal is to specify its geometric structure, use this structure to summarize and embed into simpler spaces where computations can be done efficiently, and when this is not possible, identify how to minimally fix the data to facilitate these tasks. The project's focus is on three interrelated topics concerning geometric structure that lie at the intersection of big data, geometry, and machine learning: 1) data factorization and sparsification, 2) metric embeddings for structured spaces, and 3) metric violation distance. The ultimate purpose is to develop better algorithms for handling data, ranging from better clustering algorithms to better classification algorithms. The ubiquity of such algorithms implies that any progress has the potential for significant real world impact.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
使用几何来寻找数据中的结构是一个古老的想法(柏拉图被引用说,“上帝总是几何化”),随着我们的数据变化而获得新的应用。今天的数据集,来自机器学习等领域,通常是海量和高维的:例如,当试图对新闻文章进行分类时,每篇文章可能被表示为一个点,其中每个词的频率是不同的维度。这就导致了很难直观地把握几何形状,也很难通过计算来处理几何形状(“维数灾难”)。找到近似保留几何结构的数据点的较小且较低维度的子集不仅减少了计算时间,而且可以通过抑制无关特征来改善结果。在更结构化的空间中表示一般空间的点间距离可以支持新的操作,例如通过映射屏幕的2-D平面的数据可视化,或者通过映射到树的分层结构的更有效的计算。该项目采用了梳理几何结构的古老实践,并将其应用于现代世界的高维数据集。通过采用几何方法解决大数据和机器学习等领域的基础问题,该项目旨在将计算几何与其他领域更紧密地联系起来,从而使计算几何的经典领域现代化并推进其他领域。该项目的教育目标将通过直接支持学生对概述主题的研究来实现,将主题纳入开发新课程,并定期组织研讨会,以增加获奖机构算法和理论计算机科学的知名度和跨学科性质。给定一个数据集,目标是指定其几何结构,使用这种结构来总结和嵌入到更简单的空间中,在这些空间中可以有效地完成计算,当这是不可能的时候,确定如何最小限度地修复数据以促进这些任务。 该项目的重点是关于几何结构的三个相互关联的主题,这些主题位于大数据,几何和机器学习的交叉点:1)数据因子分解和稀疏化,2)结构化空间的度量嵌入,以及3)度量违规距离。 最终目的是开发更好的算法来处理数据,从更好的聚类算法到更好的分类算法。这种算法的普遍性意味着任何进展都有可能对真实的世界产生重大影响。该奖项反映了NSF的法定使命,并被认为值得通过使用基金会的知识价值和更广泛的影响审查标准进行评估来支持。

项目成果

期刊论文数量(18)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Sparse convex hull coverage
  • DOI:
    10.1016/j.comgeo.2021.101787
  • 发表时间:
    2021-05-21
  • 期刊:
  • 影响因子:
    0.6
  • 作者:
    Klimenko, Georgiy;Raichel, Benjamin;Van Buskirk, Gregory
  • 通讯作者:
    Van Buskirk, Gregory
Approximation Algorithms for Multi-Robot Patrol-Scheduling with Min-Max Latency
具有最小-最大延迟的多机器人巡逻调度近似算法
Viewing the Rings of a Tree: Minimum Distortion Embeddings into Trees
查看树的年轮:最小失真嵌入树中
Clustering with Neighborhoods
邻域聚类
Clustering with Faulty Centers
具有故障中心的聚类
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Benjamin Raichel其他文献

On the Budgeted Hausdorff Distance Problem
关于预算Hausdorff距离问题
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Sariel Har;Benjamin Raichel
  • 通讯作者:
    Benjamin Raichel
Fr\'echet Distance Revisited and Extended
Frechet距离的重新审视和扩展
  • DOI:
  • 发表时间:
    2012
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Sariel Har;Benjamin Raichel
  • 通讯作者:
    Benjamin Raichel
On the expected complexity of voronoi diagrams on terrains
关于地形 voronoi 图的预期复杂度
Correction to: Avoiding the Global Sort: A Faster Contour Tree Algorithm
  • DOI:
    10.1007/s00454-022-00417-5
  • 发表时间:
    2022-08-22
  • 期刊:
  • 影响因子:
    0.600
  • 作者:
    Benjamin Raichel;C. Seshadhri
  • 通讯作者:
    C. Seshadhri
Space Exploration via Proximity Search
通过邻近搜索进行空间探索
  • DOI:
    10.1007/s00454-016-9801-7
  • 发表时间:
    2014
  • 期刊:
  • 影响因子:
    0.8
  • 作者:
    Sariel Har;Nirman Kumar;D. Mount;Benjamin Raichel
  • 通讯作者:
    Benjamin Raichel

Benjamin Raichel的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Benjamin Raichel', 18)}}的其他基金

Travel: Student Travel Grant for 2023 Computational Geometry Week
旅行:2023 年计算几何周学生旅行补助金
  • 批准号:
    2321292
  • 财政年份:
    2023
  • 资助金额:
    $ 49.7万
  • 项目类别:
    Standard Grant
CRII: AF: Breaking Barriers for Geometric Data
CRII:AF:打破几何数据的障碍
  • 批准号:
    1566137
  • 财政年份:
    2016
  • 资助金额:
    $ 49.7万
  • 项目类别:
    Standard Grant

相似国自然基金

基于前瞻性队列的双酚AF联合果糖加重代谢损伤的靶向代谢组学研究
  • 批准号:
    2025JJ30049
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
U2AF2-circMMP1信号轴促进结直肠癌进展的分子机制研究
  • 批准号:
    2025JJ80723
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
U2AF2精氯酸甲基化调控RNA转录合成在MTAP缺失骨肉瘤T细胞耗竭中的机制研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0 万元
  • 项目类别:
    青年科学基金项目
BDA-366通过MYD88/NF-κB/PGC1β通路杀伤 KMT2A/AF9 AML细胞的机制研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    15.0 万元
  • 项目类别:
    省市级项目
Lu AF21934减少缺血性脑卒中导致的神经损伤的机制研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
H2S介导剪接因子BraU2AF65a的S-巯基化修饰促进大白菜开花的分子机制
  • 批准号:
    32372727
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
AF9通过ARRB2-MRGPRB2介导肠固有肥大细胞活化促进重症急性胰腺炎发生MOF的研究
  • 批准号:
    82300739
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
剪接因子U2AF1突变在急性髓系白血病原发耐药中的机制研究
  • 批准号:
    82370157
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目
线粒体活性氧介导的胎盘早衰在孕期双酚AF暴露致婴幼儿神经发育迟缓中的作用
  • 批准号:
    82304160
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
U2AF2-circMMP1调控能量代谢促进结直肠癌肝转移的分子机制
  • 批准号:
    82303789
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

AF: Small: Problems in Algorithmic Game Theory for Online Markets
AF:小:在线市场的算法博弈论问题
  • 批准号:
    2332922
  • 财政年份:
    2024
  • 资助金额:
    $ 49.7万
  • 项目类别:
    Standard Grant
CRII: AF: Efficiently Computing and Updating Topological Descriptors for Data Analysis
CRII:AF:高效计算和更新数据分析的拓扑描述符
  • 批准号:
    2348238
  • 财政年份:
    2024
  • 资助金额:
    $ 49.7万
  • 项目类别:
    Standard Grant
CRII: AF: The Impact of Knowledge on the Performance of Distributed Algorithms
CRII:AF:知识对分布式算法性能的影响
  • 批准号:
    2348346
  • 财政年份:
    2024
  • 资助金额:
    $ 49.7万
  • 项目类别:
    Standard Grant
CRII: AF: Streaming Approximability of Maximum Directed Cut and other Constraint Satisfaction Problems
CRII:AF:最大定向切割和其他约束满足问题的流近似性
  • 批准号:
    2348475
  • 财政年份:
    2024
  • 资助金额:
    $ 49.7万
  • 项目类别:
    Standard Grant
Collaborative Research: AF: Medium: The Communication Cost of Distributed Computation
合作研究:AF:媒介:分布式计算的通信成本
  • 批准号:
    2402836
  • 财政年份:
    2024
  • 资助金额:
    $ 49.7万
  • 项目类别:
    Continuing Grant
Collaborative Research: AF: Medium: Foundations of Oblivious Reconfigurable Networks
合作研究:AF:媒介:遗忘可重构网络的基础
  • 批准号:
    2402851
  • 财政年份:
    2024
  • 资助金额:
    $ 49.7万
  • 项目类别:
    Continuing Grant
Collaborative Research: AF: Small: New Directions in Algorithmic Replicability
合作研究:AF:小:算法可复制性的新方向
  • 批准号:
    2342244
  • 财政年份:
    2024
  • 资助金额:
    $ 49.7万
  • 项目类别:
    Standard Grant
Collaborative Research: AF: Small: Exploring the Frontiers of Adversarial Robustness
合作研究:AF:小型:探索对抗鲁棒性的前沿
  • 批准号:
    2335411
  • 财政年份:
    2024
  • 资助金额:
    $ 49.7万
  • 项目类别:
    Standard Grant
NSF-BSF: Collaborative Research: AF: Small: Algorithmic Performance through History Independence
NSF-BSF:协作研究:AF:小型:通过历史独立性实现算法性能
  • 批准号:
    2420942
  • 财政年份:
    2024
  • 资助金额:
    $ 49.7万
  • 项目类别:
    Standard Grant
Collaborative Research: AF: Medium: Algorithms Meet Machine Learning: Mitigating Uncertainty in Optimization
协作研究:AF:媒介:算法遇见机器学习:减轻优化中的不确定性
  • 批准号:
    2422926
  • 财政年份:
    2024
  • 资助金额:
    $ 49.7万
  • 项目类别:
    Continuing Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了