CIF: Small: New Directions in Clustering: Interactive Algorithms and Statistical Models
CIF:小型:聚类的新方向:交互式算法和统计模型
基本信息
- 批准号:1909046
- 负责人:
- 金额:$ 50万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2019
- 资助国家:美国
- 起止时间:2019-10-01 至 2021-06-30
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
Clustering, or partitioning data-points based on pairwise similarities, is one of the most important problems of unsupervised learning and data mining. Algorithms for clustering often suffer from low accuracy and high time complexity due to processing massive amounts of data that are noisy, and for lack of a benchmark to validate the clustering output. This project studies new directions for clustering algorithms and their fundamental limits by incorporating several new technical tools from information theory. Scalable algorithms for clustering with theoretical guarantees and practical validation should have high impact in all areas of data science.This project aims to make use of interactive algorithms that adaptively gather labeled data to improve accuracy of clustering and related machine learning problems. In recent years, wide-spread use of crowdsourcing has facilitated the development of such algorithms. The algorithms that will be developed, as well as the lower bounding methods, extend to a large class of machine learning problems, and help understand trade-off between information theoretic optimality and computational efficiency. A generalized setup taking into account erroneous interactions, use of similarity measures, overlapping clusters and parallel interactions in design of algorithms is being pursued. Connections of this setup with well-known random graph community models such as the stochastic block model will also be explored in this project. New statistical models, such as the geometric block model, will be studied as an alternative to the popular stochastic block model. Algorithms for community recovery for the geometric block model andinformation theoretic lower bounds will be developed. This project will also develop statistical models that faithfully capture the properties of real networks to provide a benchmark for testing clustering algorithms. These include statistical models for community detection and interactive clustering.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
基于成对相似性的聚类或分区数据点是无监督学习和数据挖掘的最重要问题之一。聚集的算法通常由于处理大量的嘈杂数据,并且缺乏验证聚类输出的基准,因此通常会遭受较低的精度和高时间的复杂性。该项目通过合并信息理论中的几种新技术工具来研究用于聚类算法及其基本限制的新方向。可扩展的算法用于聚类的理论保证和实际验证应在数据科学的所有领域都具有很大的影响。本项目旨在利用交互式算法,这些算法适应地收集标记的数据以提高聚类和相关机器学习问题的准确性。近年来,对众包的广泛使用促进了这种算法的发展。将开发的算法以及下边界方法扩展到大量的机器学习问题,并有助于了解信息理论最优和计算效率之间的权衡。考虑到错误的相互作用,使用相似性度量,重叠群集和算法设计中的并行相互作用,这是一种广义设置。该设置与众所周知的随机图社区模型(例如随机块模型)的连接也将在此项目中探索。将研究新的统计模型,例如几何模型模型,作为流行随机块模型的替代方法。将开发用于几何块模型的社区恢复算法,并开发信息理论下限。该项目还将开发统计模型,这些模型忠实地捕获真实网络的属性,以提供测试聚类算法的基准。这些奖项反映了NSF的法定任务,这些奖项包括用于社区检测和互动聚类的统计模型,并被认为是通过基金会的知识分子优点和更广泛的影响评估标准来评估值得支持的。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Arya Mazumdar其他文献
Improved Support Recovery in Universal 1-bit Compressed Sensing
改进了通用 1 位压缩感知中的支持恢复
- DOI:
- 发表时间:
2024 - 期刊:
- 影响因子:2.5
- 作者:
Namiko Matsumoto;Arya Mazumdar;S. Pal - 通讯作者:
S. Pal
The TILOS AI Institute: Integrating optimization and AI for chip design, networks, and robotics
TILOS AI 研究所:将优化和 AI 集成到芯片设计、网络和机器人领域
- DOI:
10.1002/aaai.12165 - 发表时间:
2024 - 期刊:
- 影响因子:0
- 作者:
Andrew B. Kahng;Arya Mazumdar;Jodi Reeves;Yusu Wang - 通讯作者:
Yusu Wang
Competing Bandits in Non-Stationary Matching Markets
非平稳匹配市场中的竞争强盗
- DOI:
10.1109/tit.2024.3352228 - 发表时间:
2024 - 期刊:
- 影响因子:2.5
- 作者:
A. Ghosh;Abishek Sankararaman;K. Ramchandran;Tara Javidi;Arya Mazumdar - 通讯作者:
Arya Mazumdar
Improved Support Recovery in Universal One-bit Compressed Sensing
改进了通用一位压缩感知中的支撑恢复
- DOI:
- 发表时间:
2022 - 期刊:
- 影响因子:0
- 作者:
Namiko Matsumoto;Arya Mazumdar;S. Pal - 通讯作者:
S. Pal
Novel Impossibility Results for Group-Testing
小组测试的新不可能结果
- DOI:
10.1109/isit.2018.8437471 - 发表时间:
2018 - 期刊:
- 影响因子:0
- 作者:
Abhishek Agarwal;S. Jaggi;Arya Mazumdar - 通讯作者:
Arya Mazumdar
Arya Mazumdar的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Arya Mazumdar', 18)}}的其他基金
CIF: Small: New Directions in Clustering: Interactive Algorithms and Statistical Models
CIF:小型:聚类的新方向:交互式算法和统计模型
- 批准号:
2133484 - 财政年份:2021
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
CAREER: Reliability in Large-Scale Storage
职业:大规模存储的可靠性
- 批准号:
2127929 - 财政年份:2021
- 资助金额:
$ 50万 - 项目类别:
Continuing Grant
CAREER: Reliability in Large-Scale Storage
职业:大规模存储的可靠性
- 批准号:
1642658 - 财政年份:2016
- 资助金额:
$ 50万 - 项目类别:
Continuing Grant
CIF: Small: Collaborative Research: Ordinal Data Compression
CIF:小型:协作研究:有序数据压缩
- 批准号:
1642550 - 财政年份:2016
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
CCF-BSF: CIF: Small: Collaborative Research: Coding and Information - Theoretic Aspects of Local Data Recovery
CCF-BSF:CIF:小型:协作研究:编码和信息 - 本地数据恢复的理论方面
- 批准号:
1618512 - 财政年份:2016
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
CIF: Small: Collaborative Research: Ordinal Data Compression
CIF:小型:协作研究:有序数据压缩
- 批准号:
1526763 - 财政年份:2015
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
CAREER: Reliability in Large-Scale Storage
职业:大规模存储的可靠性
- 批准号:
1453121 - 财政年份:2015
- 资助金额:
$ 50万 - 项目类别:
Continuing Grant
CIF: Small: Collaborative Research: Combinatorial Joint Source-Channel Coding
CIF:小型:协作研究:组合联合源通道编码
- 批准号:
1318093 - 财政年份:2013
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
相似国自然基金
基于多时序CT影像与病理WSI的非小细胞肺癌新辅助免疫治疗疗效预测研究
- 批准号:82360356
- 批准年份:2023
- 资助金额:32 万元
- 项目类别:地区科学基金项目
PHLDA3通过ALDH1A1调控非小细胞肺癌干性促进新辅助化疗耐药的作用和机制研究
- 批准号:82302950
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
基于免疫多肽组学对小细胞肺癌新靶点STMN1抗原表位的解析及在TCR-T治疗中的应用研究
- 批准号:82303772
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
AMPK信号传递介导加州新小绥螨对高温适应的调控机制
- 批准号:32302425
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
基于影像组学术前预测可切除非小细胞肺癌新辅助免疫治疗疗效的研究
- 批准号:
- 批准年份:2022
- 资助金额:30 万元
- 项目类别:青年科学基金项目
相似海外基金
Collaborative Research: CIF: Small: New Theory, Algorithms and Applications for Large-Scale Bilevel Optimization
合作研究:CIF:小型:大规模双层优化的新理论、算法和应用
- 批准号:
2311274 - 财政年份:2023
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
Collaborative Research: CIF: Small: New Theory, Algorithms and Applications for Large-Scale Bilevel Optimization
合作研究:CIF:小型:大规模双层优化的新理论、算法和应用
- 批准号:
2311275 - 财政年份:2023
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
Collaborative Research: CIF: Small: New Theory and Applications of Non-smooth and Non-Lipschitz Riemannian Optimization
合作研究:CIF:小:非光滑和非Lipschitz黎曼优化的新理论和应用
- 批准号:
2308597 - 财政年份:2022
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
Collaborative Research: CIF: Small: A New Paradigm for Distributed Information Processing, Simulation and Inference in Networks: The Promise of Law of Small Numbers
合作研究:CIF:小:网络中分布式信息处理、模拟和推理的新范式:小数定律的承诺
- 批准号:
2241057 - 财政年份:2022
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
Collaborative Research: CIF: Small: A New Paradigm for Distributed Information Processing, Simulation and Inference in Networks: The Promise of Law of Small Numbers
合作研究:CIF:小:网络中分布式信息处理、模拟和推理的新范式:小数定律的承诺
- 批准号:
2132815 - 财政年份:2021
- 资助金额:
$ 50万 - 项目类别:
Standard Grant