CIF: Small: New Directions in Clustering: Interactive Algorithms and Statistical Models
CIF:小型:聚类的新方向:交互式算法和统计模型
基本信息
- 批准号:2133484
- 负责人:
- 金额:$ 50万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2021
- 资助国家:美国
- 起止时间:2021-06-01 至 2024-10-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
Clustering, or partitioning data-points based on pairwise similarities, is one of the most important problems of unsupervised learning and data mining. Algorithms for clustering often suffer from low accuracy and high time complexity due to processing massive amounts of data that are noisy, and for lack of a benchmark to validate the clustering output. This project studies new directions for clustering algorithms and their fundamental limits by incorporating several new technical tools from information theory. Scalable algorithms for clustering with theoretical guarantees and practical validation should have high impact in all areas of data science.This project aims to make use of interactive algorithms that adaptively gather labeled data to improve accuracy of clustering and related machine learning problems. In recent years, wide-spread use of crowdsourcing has facilitated the development of such algorithms. The algorithms that will be developed, as well as the lower bounding methods, extend to a large class of machine learning problems, and help understand trade-off between information theoretic optimality and computational efficiency. A generalized setup taking into account erroneous interactions, use of similarity measures, overlapping clusters and parallel interactions in design of algorithms is being pursued. Connections of this setup with well-known random graph community models such as the stochastic block model will also be explored in this project. New statistical models, such as the geometric block model, will be studied as an alternative to the popular stochastic block model. Algorithms for community recovery for the geometric block model andinformation theoretic lower bounds will be developed. This project will also develop statistical models that faithfully capture the properties of real networks to provide a benchmark for testing clustering algorithms. These include statistical models for community detection and interactive clustering.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
聚类,或基于成对相似性划分数据点,是无监督学习和数据挖掘中最重要的问题之一。聚类算法通常遭受低精度和高时间复杂度,由于处理大量的数据是嘈杂的,并缺乏一个基准来验证聚类输出。这个项目研究聚类算法的新方向和它们的基本限制,通过结合信息论的几个新的技术工具。具有理论保证和实践验证的可扩展聚类算法应该在数据科学的所有领域都有很高的影响力。本项目旨在利用自适应收集标记数据的交互式算法来提高聚类和相关机器学习问题的准确性。近年来,众包的广泛使用促进了此类算法的发展。将开发的算法以及下界方法扩展到一大类机器学习问题,并帮助理解信息理论最优性和计算效率之间的权衡。一个广义的设置,考虑到错误的相互作用,使用相似性措施,重叠集群和并行的算法设计中的相互作用正在追求。该项目还将探讨这种设置与众所周知的随机图社区模型(如随机块模型)的连接。将研究新的统计模型,如几何块模型,作为流行的随机块模型的替代方法。将发展几何块模型和信息论下界的社区恢复算法.这个项目还将开发统计模型,忠实地捕捉真实的网络的属性,为测试聚类算法提供基准。该奖项反映了NSF的法定使命,并被认为值得通过使用基金会的知识价值和更广泛的影响审查标准进行评估来支持。
项目成果
期刊论文数量(10)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
The Complexity of Average-Case Dynamic Subgraph Counting
平均情况动态子图计数的复杂性
- DOI:10.1137/1.9781611977073.23
- 发表时间:2022
- 期刊:
- 影响因子:0
- 作者:Henzinger, Monika;Lincoln, Andrea;and Saha, Barna
- 通讯作者:and Saha, Barna
BEER: Blocking for Effective Entity Resolution
BEER:阻止有效的实体解析
- DOI:10.1145/3448016.3452747
- 发表时间:2021
- 期刊:
- 影响因子:0
- 作者:Galhotra, Sainyam;Firmani, Donatella;Saha, Barna;Srivastava, Divesh
- 通讯作者:Srivastava, Divesh
Byzantine Resilient Distributed Clustering with Redundant Data Assignment
具有冗余数据分配的拜占庭弹性分布式集群
- DOI:
- 发表时间:2021
- 期刊:
- 影响因子:0
- 作者:Bulusu, Saikiran;Gandikota, Venkata;Mazumdar, Arya;Rawat, Ankit Singh;Varshney, Pramod
- 通讯作者:Varshney, Pramod
On Learning Mixture of Linear Regressions in the Non-Realizable Setting
- DOI:10.48550/arxiv.2205.13166
- 发表时间:2022-05
- 期刊:
- 影响因子:0
- 作者:Avishek Ghosh;A. Mazumdar;S. Pal;Rajat Sen
- 通讯作者:Avishek Ghosh;A. Mazumdar;S. Pal;Rajat Sen
Semisupervised Clustering by Queries and Locally Encodable Source Coding
通过查询和本地可编码源编码进行半监督聚类
- DOI:10.1109/tit.2020.3037533
- 发表时间:2021
- 期刊:
- 影响因子:2.5
- 作者:Mazumdar, Arya;Pal, Soumyabrata
- 通讯作者:Pal, Soumyabrata
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Arya Mazumdar其他文献
Improved Support Recovery in Universal 1-bit Compressed Sensing
改进了通用 1 位压缩感知中的支持恢复
- DOI:
- 发表时间:
2024 - 期刊:
- 影响因子:2.5
- 作者:
Namiko Matsumoto;Arya Mazumdar;S. Pal - 通讯作者:
S. Pal
The TILOS AI Institute: Integrating optimization and AI for chip design, networks, and robotics
TILOS AI 研究所:将优化和 AI 集成到芯片设计、网络和机器人领域
- DOI:
10.1002/aaai.12165 - 发表时间:
2024 - 期刊:
- 影响因子:0
- 作者:
Andrew B. Kahng;Arya Mazumdar;Jodi Reeves;Yusu Wang - 通讯作者:
Yusu Wang
Improved Support Recovery in Universal One-bit Compressed Sensing
改进了通用一位压缩感知中的支撑恢复
- DOI:
- 发表时间:
2022 - 期刊:
- 影响因子:0
- 作者:
Namiko Matsumoto;Arya Mazumdar;S. Pal - 通讯作者:
S. Pal
Competing Bandits in Non-Stationary Matching Markets
非平稳匹配市场中的竞争强盗
- DOI:
10.1109/tit.2024.3352228 - 发表时间:
2024 - 期刊:
- 影响因子:2.5
- 作者:
A. Ghosh;Abishek Sankararaman;K. Ramchandran;Tara Javidi;Arya Mazumdar - 通讯作者:
Arya Mazumdar
Novel Impossibility Results for Group-Testing
小组测试的新不可能结果
- DOI:
10.1109/isit.2018.8437471 - 发表时间:
2018 - 期刊:
- 影响因子:0
- 作者:
Abhishek Agarwal;S. Jaggi;Arya Mazumdar - 通讯作者:
Arya Mazumdar
Arya Mazumdar的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Arya Mazumdar', 18)}}的其他基金
CAREER: Reliability in Large-Scale Storage
职业:大规模存储的可靠性
- 批准号:
2127929 - 财政年份:2021
- 资助金额:
$ 50万 - 项目类别:
Continuing Grant
CIF: Small: New Directions in Clustering: Interactive Algorithms and Statistical Models
CIF:小型:聚类的新方向:交互式算法和统计模型
- 批准号:
1909046 - 财政年份:2019
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
CAREER: Reliability in Large-Scale Storage
职业:大规模存储的可靠性
- 批准号:
1642658 - 财政年份:2016
- 资助金额:
$ 50万 - 项目类别:
Continuing Grant
CIF: Small: Collaborative Research: Ordinal Data Compression
CIF:小型:协作研究:有序数据压缩
- 批准号:
1642550 - 财政年份:2016
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
CCF-BSF: CIF: Small: Collaborative Research: Coding and Information - Theoretic Aspects of Local Data Recovery
CCF-BSF:CIF:小型:协作研究:编码和信息 - 本地数据恢复的理论方面
- 批准号:
1618512 - 财政年份:2016
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
CIF: Small: Collaborative Research: Ordinal Data Compression
CIF:小型:协作研究:有序数据压缩
- 批准号:
1526763 - 财政年份:2015
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
CAREER: Reliability in Large-Scale Storage
职业:大规模存储的可靠性
- 批准号:
1453121 - 财政年份:2015
- 资助金额:
$ 50万 - 项目类别:
Continuing Grant
CIF: Small: Collaborative Research: Combinatorial Joint Source-Channel Coding
CIF:小型:协作研究:组合联合源通道编码
- 批准号:
1318093 - 财政年份:2013
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
相似国自然基金
昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
- 批准号:
- 批准年份:2024
- 资助金额:0.0 万元
- 项目类别:省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
- 批准号:n/a
- 批准年份:2022
- 资助金额:10.0 万元
- 项目类别:省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
- 批准号:32000033
- 批准年份:2020
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
- 批准号:31972324
- 批准年份:2019
- 资助金额:58.0 万元
- 项目类别:面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
- 批准号:81900988
- 批准年份:2019
- 资助金额:21.0 万元
- 项目类别:青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
- 批准号:31870821
- 批准年份:2018
- 资助金额:56.0 万元
- 项目类别:面上项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
- 批准号:31802058
- 批准年份:2018
- 资助金额:26.0 万元
- 项目类别:青年科学基金项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
- 批准号:31772128
- 批准年份:2017
- 资助金额:60.0 万元
- 项目类别:面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
- 批准号:81704176
- 批准年份:2017
- 资助金额:20.0 万元
- 项目类别:青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
- 批准号:91640114
- 批准年份:2016
- 资助金额:85.0 万元
- 项目类别:重大研究计划
相似海外基金
Collaborative Research: CIF: Small: New Theory, Algorithms and Applications for Large-Scale Bilevel Optimization
合作研究:CIF:小型:大规模双层优化的新理论、算法和应用
- 批准号:
2311274 - 财政年份:2023
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
Collaborative Research: CIF: Small: New Theory, Algorithms and Applications for Large-Scale Bilevel Optimization
合作研究:CIF:小型:大规模双层优化的新理论、算法和应用
- 批准号:
2311275 - 财政年份:2023
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
Collaborative Research: CIF: Small: New Theory and Applications of Non-smooth and Non-Lipschitz Riemannian Optimization
合作研究:CIF:小:非光滑和非Lipschitz黎曼优化的新理论和应用
- 批准号:
2308597 - 财政年份:2022
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
Collaborative Research: CIF: Small: A New Paradigm for Distributed Information Processing, Simulation and Inference in Networks: The Promise of Law of Small Numbers
合作研究:CIF:小:网络中分布式信息处理、模拟和推理的新范式:小数定律的承诺
- 批准号:
2241057 - 财政年份:2022
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
Collaborative Research: CIF: Small: A New Paradigm for Distributed Information Processing, Simulation and Inference in Networks: The Promise of Law of Small Numbers
合作研究:CIF:小:网络中分布式信息处理、模拟和推理的新范式:小数定律的承诺
- 批准号:
2132815 - 财政年份:2021
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
Collaborative Research: CIF: Small: A New Paradigm for Distributed Information Processing, Simulation and Inference in Networks: The Promise of Law of Small Numbers
合作研究:CIF:小:网络中分布式信息处理、模拟和推理的新范式:小数定律的承诺
- 批准号:
2132843 - 财政年份:2021
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
Collaborative Research: CIF: Small: New Theory and Applications of Non-smooth and Non-Lipschitz Riemannian Optimization
合作研究:CIF:小:非光滑和非Lipschitz黎曼优化的新理论和应用
- 批准号:
2007797 - 财政年份:2020
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
CIF: Small: Poisson matching: A new tool for information theory
CIF:小:泊松匹配:信息论的新工具
- 批准号:
2007965 - 财政年份:2020
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
CIF: Small: Deep Stochastic Geometry: A New Paradigm for Wireless Network Analysis and Design
CIF:小:深度随机几何:无线网络分析和设计的新范式
- 批准号:
2007498 - 财政年份:2020
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
CIF: Small: Alpha Loss: A New Framework for Understanding and Trading Off Computation, Accuracy, and Robustness in Machine Learning
CIF:小:Alpha 损失:理解和权衡机器学习中的计算、准确性和鲁棒性的新框架
- 批准号:
2007688 - 财政年份:2020
- 资助金额:
$ 50万 - 项目类别:
Standard Grant