RI: Small: Hard Clustering via Bayesian Nonparametrics
RI:小:通过贝叶斯非参数进行硬聚类
基本信息
- 批准号:1217433
- 负责人:
- 金额:$ 43.97万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Continuing Grant
- 财政年份:2012
- 资助国家:美国
- 起止时间:2012-07-01 至 2016-06-30
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
Modern machine learning algorithms often encounter a trade off between scalability and modeling power. For the problem of data clustering, Bayesian approaches enjoy numerous modeling advantages over classical methods, but hard clustering methods such as k-means are often preferred in practice due to their simplicity and scalability.This project explores bridging the gap between classical hard clustering methods and clustering models based on Bayesian nonparametrics. The first step is an asymptotic result connecting the Dirichlet process Gaussian mixture model with a k-means-like algorithm that does not fix the number of clusters in advance. Using this key result, the PI and his team will explore four related research directions which collectively demonstrate the utility of this asymptotic approach: (1) extensions of the analysis to hierarchical Bayesian models, leading to scalable hard clustering methods over multiple data sets; (2) connections to spectral methods and graph clustering, leading to novel and flexible graph clustering methods; (3) extensions beyond the Gaussian setting, leading to new approaches to topic modeling and other discrete-data clustering problems; and (4) extensive experiments in both the computer vision and text domains.Given that k-means is truly a workhorse of machine learning, these four directions have the potential to impact a wide array of large-scale applications including computer vision, bioinformatics, social network analysis, and many other domains. Furthermore, the research will benefit the broader community through released software and integration into coursework at Ohio State University.
现代机器学习算法经常遇到可扩展性和建模能力之间的权衡。 对于数据聚类问题,贝叶斯方法比经典方法具有许多建模优势,但硬聚类方法(如k-means)由于其简单性和可扩展性,在实践中往往是首选。 第一步是将Dirichlet过程高斯混合模型与不预先固定聚类数的k-means类算法连接起来的渐近结果。 利用这一关键结果,PI和他的团队将探索四个相关的研究方向,共同证明这种渐近方法的实用性:(1)将分析扩展到分层贝叶斯模型,从而在多个数据集上实现可扩展的硬聚类方法;(2)与谱方法和图聚类的联系,从而实现新颖灵活的图聚类方法;(3)高斯设置之外的扩展,导致主题建模和其他离散数据聚类问题的新方法;(4)在计算机视觉和文本领域进行了大量的实验。鉴于k-means确实是机器学习的主力,这四个方向有可能影响广泛的大规模应用,包括计算机视觉、生物信息学、社交网络分析和许多其他领域。 此外,该研究将通过发布的软件和融入俄亥俄州州立大学的课程工作,使更广泛的社区受益。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Mikhail Belkin其他文献
No . TR-134 Consistency of Spectral Clustering
不 。
- DOI:
- 发表时间:
2004 - 期刊:
- 影响因子:0
- 作者:
U. V. Luxburg;Mikhail Belkin;Olivier Bousquet - 通讯作者:
Olivier Bousquet
Understanding Inverse Scaling and Emergence in Multitask Representation Learning
了解多任务表示学习中的逆缩放和涌现
- DOI:
- 发表时间:
2024 - 期刊:
- 影响因子:0
- 作者:
M. E. Ildiz;Zhe Zhao;Samet Oymak;Xiangyu Chang;Yingcong Li;Christos Thrampoulidis;Lin Chen;Yifei Min;Mikhail Belkin;Aakanksha Chowdhery;Sharan Narang;Jacob Devlin;Maarten Bosma;Gaurav Mishra;Adam Roberts;Liam Collins;Hamed Hassani;M. Soltanolkotabi;Aryan Mokhtari;Sanjay Shakkottai;Provable;Simon S. Du;Wei Hu;S. Kakade;Chelsea Finn;A. Rajeswaran;Deep Ganguli;Danny Hernandez;Liane Lovitt;Amanda Askell;Yu Bai;Anna Chen;Tom Conerly;Nova Dassarma;Dawn Drain;Sheer Nelson El;El Showk;Stanislav Fort;Zac Hatfield;T. Henighan;Scott Johnston;Andy Jones;Nicholas Joseph;Jackson Kernian;Shauna Kravec;Benjamin Mann;Neel Nanda;Kamal Ndousse;Catherine Olsson;D. Amodei;Tom Brown;Jared Ka;Sam McCandlish;Chris Olah;Dario Amodei;Trevor Hastie;Andrea Montanari;Saharon Rosset;Jordan Hoffmann;Sebastian Borgeaud;A. Mensch;Elena Buchatskaya;Trevor Cai;Eliza Rutherford;Diego de;Las Casas;Lisa Anne Hendricks;Johannes Welbl;Aidan Clark;Tom Hennigan;Eric Noland;Katie Millican;George van den Driessche;Bogdan Damoc;Aurelia Guy;Simon Osindero;Karen Si;Erich Elsen;Jack W. Rae;O. Vinyals;Jared Kaplan;B. Chess;R. Child;S. Gray;Alec Radford;Jeffrey Wu;I. R. McKenzie;Alexander Lyzhov;Michael Pieler;Alicia Parrish;Aaron Mueller;Ameya Prabhu;Euan McLean;Aaron Kirtland;Alexis Ross;Alisa Liu;Andrew Gritsevskiy;Daniel Wurgaft;Derik Kauff;Gabriel Recchia;Jiacheng Liu;Joe Cavanagh;Tom Tseng;Xudong Korbak;Yuhui Shen;Zhengping Zhang;Najoung Zhou;Samuel R Kim;Bowman Ethan;Perez;Feng Ruan;Youngtak Sohn - 通讯作者:
Youngtak Sohn
Mikhail Belkin的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Mikhail Belkin', 18)}}的其他基金
RI: Small: Learning discrete structure from continuous spaces
RI:小:从连续空间学习离散结构
- 批准号:
2050360 - 财政年份:2020
- 资助金额:
$ 43.97万 - 项目类别:
Standard Grant
RI: Small: Learning discrete structure from continuous spaces
RI:小:从连续空间学习离散结构
- 批准号:
1815697 - 财政年份:2018
- 资助金额:
$ 43.97万 - 项目类别:
Standard Grant
PFI:AIR-TT: Continuous-wave room-temperature terahertz quantum cascade laser sources
PFI:AIR-TT:连续波室温太赫兹量子级联激光源
- 批准号:
1701141 - 财政年份:2017
- 资助金额:
$ 43.97万 - 项目类别:
Standard Grant
Support for International Quantum Cascade Laser School and Workshop (IQCLSW) 2016. Held in Cambridge, United Kingdom on September 4-9, 2016.
支持 2016 年国际量子级联激光学校和研讨会 (IQCLSW)。于 2016 年 9 月 4-9 日在英国剑桥举行。
- 批准号:
1624722 - 财政年份:2016
- 资助金额:
$ 43.97万 - 项目类别:
Standard Grant
EAGER: The Exploration of Geometric and Non-Geometric Structure in Data
EAGER:数据中几何和非几何结构的探索
- 批准号:
1550757 - 财政年份:2015
- 资助金额:
$ 43.97万 - 项目类别:
Standard Grant
AF: Small: Geometry and High-dimensional Inference
AF:小:几何和高维推理
- 批准号:
1422830 - 财政年份:2014
- 资助金额:
$ 43.97万 - 项目类别:
Standard Grant
Broadband THz frequency comb generation in quantum cascade lasers
量子级联激光器中宽带太赫兹频率梳的产生
- 批准号:
1408511 - 财政年份:2014
- 资助金额:
$ 43.97万 - 项目类别:
Standard Grant
EAGER: Ultrathin metasurfaces for low-intensity nonlinear optics
EAGER:用于低强度非线性光学的超薄超表面
- 批准号:
1348049 - 财政年份:2013
- 资助金额:
$ 43.97万 - 项目类别:
Standard Grant
CAREER: Terahertz semiconductor laser sources for operation above cryogenic temperatures
职业:太赫兹半导体激光源在低温下运行
- 批准号:
1150449 - 财政年份:2012
- 资助金额:
$ 43.97万 - 项目类别:
Standard Grant
RI: Small: Algebraic and Spectral Structure of Data in High Dimension
RI:小:高维数据的代数和谱结构
- 批准号:
1117707 - 财政年份:2011
- 资助金额:
$ 43.97万 - 项目类别:
Standard Grant
相似国自然基金
昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
- 批准号:
- 批准年份:2024
- 资助金额:0.0 万元
- 项目类别:省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
- 批准号:
- 批准年份:2022
- 资助金额:10.0 万元
- 项目类别:省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
- 批准号:32000033
- 批准年份:2020
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
- 批准号:31972324
- 批准年份:2019
- 资助金额:58.0 万元
- 项目类别:面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
- 批准号:81900988
- 批准年份:2019
- 资助金额:21.0 万元
- 项目类别:青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
- 批准号:31870821
- 批准年份:2018
- 资助金额:56.0 万元
- 项目类别:面上项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
- 批准号:31802058
- 批准年份:2018
- 资助金额:26.0 万元
- 项目类别:青年科学基金项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
- 批准号:31772128
- 批准年份:2017
- 资助金额:60.0 万元
- 项目类别:面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
- 批准号:81704176
- 批准年份:2017
- 资助金额:20.0 万元
- 项目类别:青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
- 批准号:91640114
- 批准年份:2016
- 资助金额:85.0 万元
- 项目类别:重大研究计划
相似海外基金
CHS: Medium: Critical Factors for Automatic Speech Recognition in Supporting Small Group Communication Between People who are Deaf or Hard of Hearing and Hearing Colleagues
CHS:中:自动语音识别支持聋哑人或听力障碍人士与听力正常同事之间小组交流的关键因素
- 批准号:
1954284 - 财政年份:2020
- 资助金额:
$ 43.97万 - 项目类别:
Standard Grant
RI: Small: A Cognitive Framework for Technical, Hard and Explainable Question Answering (THE-QA) with respect to Combined Textual and Visual Inputs
RI:小:结合文本和视觉输入的技术性、硬性和可解释性问答 (THE-QA) 的认知框架
- 批准号:
1816039 - 财政年份:2018
- 资助金额:
$ 43.97万 - 项目类别:
Standard Grant
SaTC: CORE: Small: Memory-hard Cryptography
SaTC:核心:小:内存困难的密码学
- 批准号:
1926324 - 财政年份:2018
- 资助金额:
$ 43.97万 - 项目类别:
Standard Grant
SaTC: CORE: Small: Memory-hard Cryptography
SaTC:核心:小:内存困难的密码学
- 批准号:
1719146 - 财政年份:2017
- 资助金额:
$ 43.97万 - 项目类别:
Standard Grant
RI: Small: Collaborative Research: Why is Automating the Design of Robot Controllers Hard, and What Can Be Done About It
RI:小型:协作研究:为什么机器人控制器的自动化设计很难,以及可以采取什么措施
- 批准号:
1527436 - 财政年份:2015
- 资助金额:
$ 43.97万 - 项目类别:
Standard Grant
Low-temperature deformability of brittle hard materials - new mechanical properties deduced from experiments with small-volume specimens
脆硬材料的低温变形能力——小体积样品实验推导出的新力学性能
- 批准号:
15H02300 - 财政年份:2015
- 资助金额:
$ 43.97万 - 项目类别:
Grant-in-Aid for Scientific Research (A)
RI: Small: Collaborative Research: Why is Automating the Design of Robot Controllers Hard, and What Can Be Done About It
RI:小型:协作研究:为什么机器人控制器的自动化设计很难,以及可以采取什么措施
- 批准号:
1526862 - 财政年份:2015
- 资助金额:
$ 43.97万 - 项目类别:
Standard Grant
HCC: Small: Collaborative Research: Real-Time Captioning by Groups of Non-Experts for Deaf and Hard of Hearing Students
HCC:小型:协作研究:由非专家小组为聋哑和听力障碍学生提供实时字幕
- 批准号:
1446129 - 财政年份:2014
- 资助金额:
$ 43.97万 - 项目类别:
Continuing Grant
CSR: Small: A Time-Predictable Integrated CPU-GPU Architecture for Hard Real-Time Systems
CSR:小型:用于硬实时系统的时间可预测集成 CPU-GPU 架构
- 批准号:
1421577 - 财政年份:2014
- 资助金额:
$ 43.97万 - 项目类别:
Standard Grant
Development of a wide field polarimeter for hard X-rays in small satellite
小卫星硬X射线宽视场旋光仪的研制
- 批准号:
25610042 - 财政年份:2013
- 资助金额:
$ 43.97万 - 项目类别:
Grant-in-Aid for Challenging Exploratory Research














{{item.name}}会员




