BIGDATA: Collaborative Research: F: Stochastic Approximation for Subspace and Multiview Representation Learning

BIGDATA:协作研究:F:子空间和多视图表示学习的随机逼近

基本信息

  • 批准号:
    1546500
  • 负责人:
  • 金额:
    $ 39.45万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2015
  • 资助国家:
    美国
  • 起止时间:
    2015-09-01 至 2021-08-31
  • 项目状态:
    已结题

项目摘要

Unsupervised learning of useful features, or representations, is one of the most basic challenges of machine learning. Unsupervised representation learning techniques capitalize on unlabeled data which is often cheap and abundant and sometimes virtually unlimited. The goal of these ubiquitous techniques is to learn a representation that reveals intrinsic low-dimensional structure in data, disentangles underlying factors of variation by incorporating universal AI priors such as smoothness and sparsity, and is useful across multiple tasks and domains. This project aims to develop new theory and methods for representation learning that can easily scale to large datasets. In particular, this project is concerned with methods for large-scale unsupervised feature learning, including Principal Component Analysis (PCA) and Partial Least Squares (PLS). To capitalize on massive amounts of unlabeled data, this project will develop appropriate computational approaches and study them in the ?data laden? regime. Therefore, instead of viewing representation learning as dimensionality reduction techniques and focusing on an empirical objective on finite data, these methods are studied with the goal of optimizing a population objective based on sample. This view suggests using Stochastic Approximation approaches, such as Stochastic Gradient Descent (SGD) and Stochastic Mirror Descent, that are incremental in nature and process each new sample with a computationally cheap update. Furthermore, this view enables a rigorous analysis of benefits of stochastic approximation algorithms over traditional finite-data methods. The project aims to develop stochastic approximation approaches to PCA and PLS and related problems and extensions, including deep, and sparse variants, and analyze these problems in the data-laden regime.
无监督的学习有用功能或表示形式是机器学习的最基本挑战之一。无监督的表示学习技术利用了通常便宜,丰富,有时几乎无限的未标记数据。这些无处不在的技术的目的是学习一种表示形式,该表示揭示了数据中固有的低维结构,通过合并通用AI先验(例如平滑度和稀疏性),在变化的基本因素中,并且在多个任务和域之间都是有用的。该项目旨在开发可以轻松扩展到大型数据集的代表学习的新理论和方法。特别是,该项目与大规模无监督特征学习的方法有关,包括主成分分析(PCA)和部分最小二乘(PLS)。为了利用大量未标记的数据,该项目将开发适当的计算方法并在“数据”中研究它们?政权。因此,研究这些方法的目的是旨在根据样本优化人口目标,而不是将其视为降低维度降低技术并专注于有限数据的经验目标。该观点表明,使用随机近似方法,例如随机梯度下降(SGD)和随机镜下降,它们本质上是增量的,并且可以使用计算廉价更新来处理每个新样本。此外,此观点可以严格分析与传统有限数据方法相对于传统近似方法的好处。该项目旨在为PCA和PLS以及相关的问题和扩展(包括深层和稀疏变体)开发随机近似方法,并在数据充满数据方面分析这些问题。

项目成果

期刊论文数量(10)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Efficiently Learning Adversarially Robust Halfspaces with Noise
  • DOI:
  • 发表时间:
    2020-05
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Omar Montasser;Surbhi Goel;Ilias Diakonikolas;N. Srebro
  • 通讯作者:
    Omar Montasser;Surbhi Goel;Ilias Diakonikolas;N. Srebro
Guaranteed validity for empirical approaches to adaptive data analysis
保证自适应数据分析经验方法的有效性
Does invariant risk minimization capture invariance?
不变风险最小化是否捕获了不变性?
Efficient coordinate-wise leading eigenvector computation
  • DOI:
  • 发表时间:
    2017-02
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Jialei Wang;Weiran Wang;D. Garber;N. Srebro
  • 通讯作者:
    Jialei Wang;Weiran Wang;D. Garber;N. Srebro
How do infinite width bounded norm networks look in function space?
  • DOI:
  • 发表时间:
    2019-02
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Pedro H. P. Savarese;Itay Evron;Daniel Soudry;N. Srebro
  • 通讯作者:
    Pedro H. P. Savarese;Itay Evron;Daniel Soudry;N. Srebro
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Nathan Srebro其他文献

Score Design for Multi-Criteria Incentivization
多标准激励的评分设计
Fixed-structure H∞ controller design based on Distributed Probabilistic Model-Building Genetic Algorithm
基于分布式概率建模遗传算法的固定结构H∞控制器设计
On the Complexity of Learning Sparse Functions with Statistical and Gradient Queries
关于通过统计和梯度查询学习稀疏函数的复杂性
  • DOI:
  • 发表时间:
    2024
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Nirmit Joshi;Theodor Misiakiewicz;Nathan Srebro
  • 通讯作者:
    Nathan Srebro

Nathan Srebro的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Nathan Srebro', 18)}}的其他基金

HDR TRIPODS: Collaborative Research: Institute for Data, Econometrics, Algorithms and Learning
HDR TRIPODS:协作研究:数据、计量经济学、算法和学习研究所
  • 批准号:
    1934843
  • 财政年份:
    2019
  • 资助金额:
    $ 39.45万
  • 项目类别:
    Continuing Grant
AF: RI: Medium: Collaborative Research: Understanding and Improving Optimization in Deep and Recurrent Networks
AF:RI:中:协作研究:理解和改进深度和循环网络的优化
  • 批准号:
    1764032
  • 财政年份:
    2018
  • 资助金额:
    $ 39.45万
  • 项目类别:
    Standard Grant
CCF-BSF: AF: Small: Convex and Non-Convex Distributed Learning
CCF-BSF:AF:小:凸和非凸分布式学习
  • 批准号:
    1718970
  • 财政年份:
    2018
  • 资助金额:
    $ 39.45万
  • 项目类别:
    Standard Grant
RI: AF: Medium: Learning and Matrix Reconstruction with the Max-Norm and Related Factorization Norms
RI:AF:中:使用最大范数和相关因式分解范数进行学习和矩阵重建
  • 批准号:
    1302662
  • 财政年份:
    2013
  • 资助金额:
    $ 39.45万
  • 项目类别:
    Continuing Grant

相似国自然基金

数智背景下的团队人力资本层级结构类型、团队协作过程与团队效能结果之间关系的研究
  • 批准号:
    72372084
  • 批准年份:
    2023
  • 资助金额:
    40 万元
  • 项目类别:
    面上项目
在线医疗团队协作模式与绩效提升策略研究
  • 批准号:
    72371111
  • 批准年份:
    2023
  • 资助金额:
    41 万元
  • 项目类别:
    面上项目
面向人机接触式协同作业的协作机器人交互控制方法研究
  • 批准号:
    62373044
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
基于数字孪生的颅颌面人机协作智能手术机器人关键技术研究
  • 批准号:
    82372548
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目
A-型结晶抗性淀粉调控肠道细菌协作产丁酸机制研究
  • 批准号:
    32302064
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

BIGDATA: IA: Collaborative Research: Asynchronous Distributed Machine Learning Framework for Multi-Site Collaborative Brain Big Data Mining
BIGDATA:IA:协作研究:用于多站点协作大脑大数据挖掘的异步分布式机器学习框架
  • 批准号:
    2348159
  • 财政年份:
    2023
  • 资助金额:
    $ 39.45万
  • 项目类别:
    Standard Grant
BIGDATA: IA: Collaborative Research: Intelligent Solutions for Navigating Big Data from the Arctic and Antarctic
BIGDATA:IA:协作研究:导航北极和南极大数据的智能解决方案
  • 批准号:
    2308649
  • 财政年份:
    2022
  • 资助金额:
    $ 39.45万
  • 项目类别:
    Standard Grant
BigData:IA:Collaborative Research: TIMES: A tensor factorization platform for spatio-temporal data
BigData:IA:协作研究:TIMES:时空数据张量分解平台
  • 批准号:
    2034479
  • 财政年份:
    2020
  • 资助金额:
    $ 39.45万
  • 项目类别:
    Standard Grant
BIGDATA: Collaborative Research: F: Holistic Optimization of Data-Driven Applications
BIGDATA:协作研究:F:数据驱动应用程序的整体优化
  • 批准号:
    2027516
  • 财政年份:
    2020
  • 资助金额:
    $ 39.45万
  • 项目类别:
    Standard Grant
BIGDATA: F: Collaborative Research: Practical Analysis of Large-Scale Data with Lyme Disease Case Study
BIGDATA:F:协作研究:莱姆病案例研究大规模数据的实际分析
  • 批准号:
    1934319
  • 财政年份:
    2019
  • 资助金额:
    $ 39.45万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了