EAGER: Novel sampling algorithms for scaling up spectral methods for unsupervised learning

EAGER:用于扩大无监督学习光谱方法的新型采样算法

基本信息

  • 批准号:
    1650080
  • 负责人:
  • 金额:
    $ 9万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2016
  • 资助国家:
    美国
  • 起止时间:
    2016-08-15 至 2018-07-31
  • 项目状态:
    已结题

项目摘要

In the era of big data, unsupervised learning has become increasingly important. At a high-level, unsupervised learning serves to reduce the data size, while capturing its important underlying structure. For a powerful and widely-used family of unsupervised learning techniques (those based on spectral methods), scaling up to large data sets poses significant computational challenges. This research project will develop extremely simple and lightweight sampling techniques for scaling up this family of unsupervised learning methods. Since big data is ubiquitous, these research advances are likely to be transformative to a range of fields. This project will benefit society through the research team's ongoing collaborations in climate science, agriculture, and finance. The team will also continue to engage the computer science community in this endeavor, by training students, developing tutorials, and broadening the participation of women and minorities in computing.This project will advance machine learning research by scaling up spectral methods for the analysis of large data sets. While spectral methods for the unsupervised learning tasks of clustering and embedding have found wide success in a variety of practical applications, scaling them up to large data sets poses significant computational challenges. In particular, the storage and computation needed to handle the affinity matrix (a matrix of pairwise similarities between data points) can be prohibitive. An approach that has found promise is to instead approximate this matrix in some sense. The goal of this project is to provide simple approximation techniques that manage the tradeoff between their space and time complexity vs. the quality of the approximation. The proposed approach involves sampling techniques that address this goal by exploiting latent structure in a data set, in order to minimize the amount of information that needs to be stored to (approximately) represent it. This leads to techniques that speed up the computation and reduce the memory requirements of spectral methods, while simultaneously providing better approximations. The project will also continue the team's momentum on leveraging advances in machine learning for data-driven discovery.
在大数据时代,无监督学习变得越来越重要。在高层次上,无监督学习有助于减少数据大小,同时捕获其重要的底层结构。对于一个强大且广泛使用的无监督学习技术家族(基于谱方法的技术),扩展到大数据集带来了巨大的计算挑战。该研究项目将开发非常简单和轻量级的采样技术,以扩大这一系列无监督学习方法的规模。由于大数据无处不在,这些研究进展可能会对一系列领域产生变革性影响。该项目将通过研究团队在气候科学,农业和金融方面的持续合作造福社会。该团队还将通过培训学生、开发教程以及扩大妇女和少数民族在计算领域的参与,继续让计算机科学界参与这一奋进。该项目将通过扩大光谱方法用于分析大型数据集来推进机器学习研究。虽然用于聚类和嵌入的无监督学习任务的谱方法在各种实际应用中取得了广泛的成功,但将其扩展到大型数据集带来了重大的计算挑战。特别是,处理亲和矩阵(数据点之间的成对相似性矩阵)所需的存储和计算可能是禁止的。一种有希望的方法是在某种意义上近似这个矩阵。这个项目的目标是提供简单的近似技术,管理它们的空间和时间复杂度与近似质量之间的权衡。所提出的方法涉及采样技术,通过利用数据集中的潜在结构来实现这一目标,以最大限度地减少需要存储的信息量(近似)表示it.This导致的技术,加快计算速度,减少谱方法的内存需求,同时提供更好的近似。该项目还将延续团队在利用机器学习的进步进行数据驱动发现方面的势头。

项目成果

期刊论文数量(3)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Beyond the Nystrom Approximation: Speeding up Spectral Clustering using Uniform Sampling and Weighted Kernel k-means
  • DOI:
    10.24963/ijcai.2017/347
  • 发表时间:
    2017-08
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Mahesh Mohan;C. Monteleoni
  • 通讯作者:
    Mahesh Mohan;C. Monteleoni
Convergence Rate of Stochastic k-means
随机 k 均值的收敛率
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Claire Monteleoni其他文献

Machine learning for the physics of climate
用于气候物理学的机器学习
  • DOI:
    10.1038/s42254-024-00776-3
  • 发表时间:
    2024-11-11
  • 期刊:
  • 影响因子:
    39.500
  • 作者:
    Annalisa Bracco;Julien Brajard;Henk A. Dijkstra;Pedram Hassanzadeh;Christian Lessig;Claire Monteleoni
  • 通讯作者:
    Claire Monteleoni
Pushing the frontiers in climate modelling and analysis with machine learning
利用机器学习推动气候建模与分析的前沿发展
  • DOI:
    10.1038/s41558-024-02095-y
  • 发表时间:
    2024-08-23
  • 期刊:
  • 影响因子:
    27.100
  • 作者:
    Veronika Eyring;William D. Collins;Pierre Gentine;Elizabeth A. Barnes;Marcelo Barreiro;Tom Beucler;Marc Bocquet;Christopher S. Bretherton;Hannah M. Christensen;Katherine Dagon;David John Gagne;David Hall;Dorit Hammerling;Stephan Hoyer;Fernando Iglesias-Suarez;Ignacio Lopez-Gomez;Marie C. McGraw;Gerald A. Meehl;Maria J. Molina;Claire Monteleoni;Juliane Mueller;Michael S. Pritchard;David Rolnick;Jakob Runge;Philip Stier;Oliver Watt-Meyer;Katja Weigel;Rose Yu;Laure Zanna
  • 通讯作者:
    Laure Zanna

Claire Monteleoni的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Claire Monteleoni', 18)}}的其他基金

EAGER: Collaborative Research: Learning Relations between Extreme Weather Events and Planet-Wide Environmental Trends
EAGER:合作研究:学习极端天气事件与全球环境趋势之间的关系
  • 批准号:
    1451954
  • 财政年份:
    2014
  • 资助金额:
    $ 9万
  • 项目类别:
    Standard Grant
Climate Informatics Workshop
气候信息学研讨会
  • 批准号:
    1345052
  • 财政年份:
    2013
  • 资助金额:
    $ 9万
  • 项目类别:
    Standard Grant

相似国自然基金

Novel-miR-1134调控LHCGR的表达介导拟 穴青蟹卵巢发育的机制研究
  • 批准号:
  • 批准年份:
    2025
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
novel-miR75靶向OPR2,CA2和STK基因调控人参真菌胁迫响应的分子机制研究
  • 批准号:
    82304677
  • 批准年份:
    2023
  • 资助金额:
    30.00 万元
  • 项目类别:
    青年科学基金项目
海南广藿香Novel17-GSO1响应p-HBA调控连作障碍的分子机制
  • 批准号:
    82304658
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
白术多糖通过novel-mir2双靶向TRADD/MLKL缓解免疫抑制雏鹅的胸腺程序性坏死
  • 批准号:
  • 批准年份:
    2021
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
novel-miR-59靶向HMGAs介导儿童早衰症细胞衰老的作用及机制研究
  • 批准号:
  • 批准年份:
    2021
  • 资助金额:
    58 万元
  • 项目类别:
    面上项目
novel_circ_008138/rno-miR-374-3p/SFRP4调控Wnt信号通路参与先天性肛门直肠畸形发生的分子机制研究
  • 批准号:
    82070530
  • 批准年份:
    2020
  • 资助金额:
    55 万元
  • 项目类别:
    面上项目
miRNA-novel-272通过靶向半乳糖凝集素3调控牙鲆肠道上皮细胞炎症反应的机制研究
  • 批准号:
    32002421
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
m6A修饰介导的lncRNA WEE2-AS1转录后novel-pri-miRNA剪切机制在胶质瘤恶性进展中的作用研究
  • 批准号:
  • 批准年份:
    2020
  • 资助金额:
    55 万元
  • 项目类别:
    面上项目
miRNA/novel_167靶向抑制Dmrt1的表达在红鳍东方鲀性别分化过程中的功能研究
  • 批准号:
    31902347
  • 批准年份:
    2019
  • 资助金额:
    25.0 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Examining the Function of a Novel Protein in the Cardiac Junctional Membrane Complex
检查心脏连接膜复合体中新型蛋白质的功能
  • 批准号:
    10749672
  • 财政年份:
    2024
  • 资助金额:
    $ 9万
  • 项目类别:
A novel peptide assay for hepcidin clinical monitoring
一种用于铁调素临床监测的新型肽测定方法
  • 批准号:
    10698746
  • 财政年份:
    2023
  • 资助金额:
    $ 9万
  • 项目类别:
Novel therapeutic intervention of early-stage T1D
早期 T1D 的新型治疗干预
  • 批准号:
    10698534
  • 财政年份:
    2023
  • 资助金额:
    $ 9万
  • 项目类别:
Targeting Alcohol-Opioid Co-Use Among Young Adults Using a Novel MHealth Intervention
使用新型 MHealth 干预措施针对年轻人中酒精与阿片类药物的同时使用
  • 批准号:
    10456380
  • 财政年份:
    2023
  • 资助金额:
    $ 9万
  • 项目类别:
Novel Computational Methods for Microbiome Data Analysis in Longitudinal Study
纵向研究中微生物组数据分析的新计算方法
  • 批准号:
    10660234
  • 财政年份:
    2023
  • 资助金额:
    $ 9万
  • 项目类别:
Novel Epigenetic Test for the Treatment and Improvement of Longitudinal Health-Outcomes for Men with Severe Infertility
用于治疗和改善严重不育男性纵向健康结果的新型表观遗传学测试
  • 批准号:
    10760354
  • 财政年份:
    2023
  • 资助金额:
    $ 9万
  • 项目类别:
Novel Immunogens to Elicit Broadly Cross-reactive Antibodies That Target the Hemagglutinin Head Trimer Interface
新型免疫原可引发针对血凝素头三聚体界面的广泛交叉反应抗体
  • 批准号:
    10782567
  • 财政年份:
    2023
  • 资助金额:
    $ 9万
  • 项目类别:
Protecting children's health by applying novel approaches to assess urban and rural drinking water
应用新方法评估城乡饮用水,保护儿童健康
  • 批准号:
    10724209
  • 财政年份:
    2023
  • 资助金额:
    $ 9万
  • 项目类别:
Application of deep learning and novel survival models to predict MCI-to-AD dementia progression
应用深度学习和新型生存模型预测 MCI 至 AD 痴呆的进展
  • 批准号:
    10725359
  • 财政年份:
    2023
  • 资助金额:
    $ 9万
  • 项目类别:
Probing functional HIV-1 envelope glycoprotein conformations with novel potent CD4-mimetic compounds
用新型有效的 CD4 模拟化合物探测功能性 HIV-1 包膜糖蛋白构象
  • 批准号:
    10762703
  • 财政年份:
    2023
  • 资助金额:
    $ 9万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了