CAREER: Geometric Algorithms For Data Analysis In Spaces Of Distributions
职业:分布空间数据分析的几何算法
基本信息
- 批准号:0953066
- 负责人:
- 金额:$ 48.91万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Continuing Grant
- 财政年份:2010
- 资助国家:美国
- 起止时间:2010-02-01 至 2016-01-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
Collections of distributions arise naturally when analyzing large data sets. Since it is impractical to store all but a small fraction of such data, distributional representations are typically used to summarize the data in compact form. For example, a document in a corpus is typically represented by a normalized vector of frequencies of occurrence of keywords, an image is represented by a histogram over gradient features and speech signals are represented by spectral densities over a frequency domain.Representing data sets as collections of distributions enables analysis via powerful concepts from statistics, learning theory and information theory. Concepts like strength of belief, information content, and pattern likelihood are used to extract meaning and structure from the data and are quantified using information measures like the Kullback-Leibler distance and its parent class, the Bregman divergences.These measures capture meaning in data in a manner that traditional metrics cannot, by connecting abstract notions of information loss and transfer with concrete geometric notions like distances. However, they lack properties like symmetry and the triangle inequality that are essential requirements for the application of traditional geometric algorithms for data analysis.In this project, the PI will develop a systematic, rigorous and global algorithmic framework for manipulating these distances. This framework will provide the foundation for efficient and accurate data analysis of spaces of distributions, and will lead to deeper insights into analysis problems across a wide range of applications.
在分析大型数据集时,自然会出现分布集合。由于除了一小部分数据之外存储所有数据是不切实际的,因此通常使用分布表示来以紧凑的形式总结数据。例如,语料库中的文档通常由关键字出现频率的归一化向量表示,图像由梯度特征上的直方图表示,语音信号由频域上的谱密度表示。将数据集表示为分布的集合使得能够通过来自统计学、学习理论和信息论的强大概念进行分析。 信念强度、信息量和模式似然性等概念被用来从数据中提取意义和结构,并使用Kullback-Leibler距离及其父类Bregman分歧等信息度量进行量化。这些度量通过将信息丢失和传输的抽象概念与距离等具体几何概念联系起来,以传统度量无法实现的方式捕捉数据中的意义。然而,它们缺乏对称性和三角不等式等属性,而这些属性是应用传统几何算法进行数据分析的基本要求。在本项目中,PI将开发一个系统的,严格的和全局的算法框架来操作这些距离。该框架将为分布空间的有效和准确的数据分析提供基础,并将导致对广泛应用中的分析问题的更深入的见解。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Suresh Venkatasubramanian其他文献
Rectangular layouts and contact graphs
矩形布局和接触图
- DOI:
10.1145/1328911.1328919 - 发表时间:
2006 - 期刊:
- 影响因子:0
- 作者:
A. Buchsbaum;E. Gansner;Cecilia M. Procopiuc;Suresh Venkatasubramanian - 通讯作者:
Suresh Venkatasubramanian
Computational geometry column 55: new developments in nonnegative matrix factorization
计算几何专栏55:非负矩阵分解的新进展
- DOI:
- 发表时间:
2013 - 期刊:
- 影响因子:0
- 作者:
Suresh Venkatasubramanian - 通讯作者:
Suresh Venkatasubramanian
Active Online Multitask Learning
主动在线多任务学习
- DOI:
- 发表时间:
2010 - 期刊:
- 影响因子:0
- 作者:
A. Saha;Piyush Rai;Hal Daumé;Suresh Venkatasubramanian - 通讯作者:
Suresh Venkatasubramanian
You Still See Me: How Data Protection Supports the Architecture of ML Surveillance
你仍然看到我:数据保护如何支持机器学习监控架构
- DOI:
10.48550/arxiv.2402.06609 - 发表时间:
2024 - 期刊:
- 影响因子:0
- 作者:
Rui;Lucy Qin;Suresh Venkatasubramanian - 通讯作者:
Suresh Venkatasubramanian
Sketching, Embedding, and Dimensionality Reduction for Information Spaces
信息空间的草图、嵌入和降维
- DOI:
- 发表时间:
2015 - 期刊:
- 影响因子:0
- 作者:
A. Abdullah;Ravi Kumar;A. Mcgregor;Sergei Vassilvitskii;Suresh Venkatasubramanian - 通讯作者:
Suresh Venkatasubramanian
Suresh Venkatasubramanian的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Suresh Venkatasubramanian', 18)}}的其他基金
BIGDATA: Collaborative Research: F: Algorithmic Fairness: A Systemic and Foundational Treatment of Nondiscriminatory Data Mining
BIGDATA:协作研究:F:算法公平性:非歧视性数据挖掘的系统性和基础性处理
- 批准号:
1633724 - 财政年份:2016
- 资助金额:
$ 48.91万 - 项目类别:
Standard Grant
BIGDATA: Small: DA: Collaborative Research: From Data to Users: Providing Interpretable and Verifiable Explanations in Data Mining
BIGDATA:小:DA:协作研究:从数据到用户:在数据挖掘中提供可解释和可验证的解释
- 批准号:
1251049 - 财政年份:2013
- 资助金额:
$ 48.91万 - 项目类别:
Standard Grant
AF: Small: Synopsis Data Structures for Data Analysis in Shape Spaces
AF:小:形状空间中数据分析的概要数据结构
- 批准号:
1115677 - 财政年份:2011
- 资助金额:
$ 48.91万 - 项目类别:
Standard Grant
SGER: Scalable Shape Analysis in Non-Euclidean Spaces with Provable Guarantees
SGER:具有可证明保证的非欧几里得空间中的可扩展形状分析
- 批准号:
0841185 - 财政年份:2009
- 资助金额:
$ 48.91万 - 项目类别:
Standard Grant
Workshop on Computational Geometry and Visualization
计算几何与可视化研讨会
- 批准号:
0602527 - 财政年份:2005
- 资助金额:
$ 48.91万 - 项目类别:
Standard Grant
相似国自然基金
Lagrangian origin of geometric approaches to scattering amplitudes
- 批准号:24ZR1450600
- 批准年份:2024
- 资助金额:0.0 万元
- 项目类别:省市级项目
相似海外基金
CAREER: Geometric Techniques for Topological Graph Algorithms
职业:拓扑图算法的几何技术
- 批准号:
2237288 - 财政年份:2023
- 资助金额:
$ 48.91万 - 项目类别:
Continuing Grant
CAREER: Geometric Phenomena in Algorithms and Complexity
职业:算法和复杂性中的几何现象
- 批准号:
0644037 - 财政年份:2007
- 资助金额:
$ 48.91万 - 项目类别:
Continuing Grant
CAREER: Fundamental Geometric Algorithms
职业:基本几何算法
- 批准号:
0641402 - 财政年份:2007
- 资助金额:
$ 48.91万 - 项目类别:
Continuing Grant
CAREER: Geometric Algorithms for Wireless Sensor Networks
职业:无线传感器网络的几何算法
- 批准号:
0643687 - 财政年份:2007
- 资助金额:
$ 48.91万 - 项目类别:
Standard Grant
CAREER: Efficient Algorithms for Computational Problems in Bioinformatics Via Combinatorial and Geometric Techniques
职业:通过组合和几何技术解决生物信息学计算问题的有效算法
- 批准号:
0346973 - 财政年份:2004
- 资助金额:
$ 48.91万 - 项目类别:
Continuing Grant
CAREER: Approximate Algorithms for High-dimensional Geometric Problems
职业:高维几何问题的近似算法
- 批准号:
0133849 - 财政年份:2002
- 资助金额:
$ 48.91万 - 项目类别:
Continuing Grant
CAREER: Approximation Algorithms for Geometric Computing
职业:几何计算的近似算法
- 批准号:
0132901 - 财政年份:2002
- 资助金额:
$ 48.91万 - 项目类别:
Continuing Grant
CAREER: Realistically Efficient Geometric Algorithms
职业:现实高效的几何算法
- 批准号:
0093348 - 财政年份:2001
- 资助金额:
$ 48.91万 - 项目类别:
Continuing Grant
CAREER: I/O-Efficient Geometric Algorithms
职业:I/O 高效的几何算法
- 批准号:
9984099 - 财政年份:2000
- 资助金额:
$ 48.91万 - 项目类别:
Continuing Grant
CAREER: Geometric Tools for Algorithms
职业:算法的几何工具
- 批准号:
9875024 - 财政年份:1999
- 资助金额:
$ 48.91万 - 项目类别:
Continuing Grant