RI: Small: Random Perturbation Methods in Sequential Learning
RI:小:顺序学习中的随机扰动方法
基本信息
- 批准号:2007055
- 负责人:
- 金额:$ 45万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Continuing Grant
- 财政年份:2020
- 资助国家:美国
- 起止时间:2020-10-01 至 2024-09-30
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
Neither babies nor machines begin learning from a blank slate. Just like a baby comes into the world with brain structures that predispose her to learn motor and language skills, a machine has to be given enough prior structure to help it learn. This prior structure is called inductive bias in the field of machine learning. Inductive bias can take many forms, which is why there are many different sorts of machine learning algorithms. For example, the machine could be told that similar inputs should produce similar outputs, or that it should prefer simpler models over complex ones. Recently a class of methods has emerged that uses randomness to inject inductive bias into machine learning algorithms. However, researchers do not fully understand the power and limitations of these methods. For example, what is the relationship between injecting randomness and having a preference for simpler models? This project studies such fundamental questions about the power of randomness in designing machine learning algorithms. The algorithms developed in this project can be applied to many problems of practical interest including the discovery of cheap renewable energy sources.The technical goals of this project are divided into three categories according to the underlying sequential learning problem: online learning, bandit problems, and reinforcement learning. In online learning, the project examines the universality of perturbations. That is, are perturbation-based algorithms powerful enough to realize optimal performance guarantees in any online convex optimization problem? This work also aims to discover universal perturbation-based online learning algorithms that succeed in learning a problem as soon as the problem is online learnable. In bandit problems, random perturbations are used to design algorithms that are robust to non-stationarity and corruptions in the observed rewards. In reinforcement learning, exploration strategies based on random perturbations are designed that are both computationally tractable and sample efficient.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
无论是婴儿还是机器都不是从白板开始学习的。就像婴儿来到这个世界时,大脑结构使她易于学习运动和语言技能一样,机器必须被赋予足够的优先结构来帮助它学习。这种先验结构在机器学习领域被称为归纳偏差。归纳偏差可以有多种形式,这就是为什么有许多不同种类的机器学习算法。例如,可以告诉机器类似的输入应该产生类似的输出,或者它应该更喜欢更简单的模型而不是复杂的模型。最近,出现了一类利用随机性将归纳偏差注入机器学习算法的方法。然而,研究人员并没有完全了解这些方法的威力和局限性。例如,注入随机性和偏爱更简单的模型之间有什么关系?这个项目研究了在设计机器学习算法时随机性的力量等基本问题。该项目开发的算法可以应用于许多有实际意义的问题,包括发现廉价的可再生能源。根据潜在的顺序学习问题,该项目的技术目标分为三类:在线学习、强盗问题和强化学习。在在线学习中,该项目考察了扰动的普遍性。也就是说,基于扰动的算法是否足够强大,能够在任何在线凸优化问题中实现最优性能保证?这项工作还旨在发现通用的基于扰动的在线学习算法,一旦问题可在线学习,就能成功地学习该问题。在强盗问题中,随机扰动被用来设计算法,该算法对观察到的奖励中的非平稳性和腐败具有鲁棒性。在强化学习中,基于随机扰动的探索策略的设计既便于计算,又具有样本效率。该奖项反映了NSF的法定使命,并通过使用基金会的智力优势和更广泛的影响审查标准进行评估,被认为值得支持。
项目成果
期刊论文数量(17)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Online Agnostic Multiclass Boosting
在线不可知多类提升
- DOI:
- 发表时间:2022
- 期刊:
- 影响因子:0
- 作者:Raman, Vinod;Tewari, Ambuj
- 通讯作者:Tewari, Ambuj
On the Statistical Benefits of Curriculum Learning
- DOI:
- 发表时间:2021-11
- 期刊:
- 影响因子:0
- 作者:Ziping Xu;Ambuj Tewari
- 通讯作者:Ziping Xu;Ambuj Tewari
Weighted Gaussian Process Bandits for Non-stationary Environments
- DOI:
- 发表时间:2021-07
- 期刊:
- 影响因子:0
- 作者:Yuntian Deng-;Xingyu Zhou;Baekjin Kim;Ambuj Tewari;Abhishek Gupta;N. Shroff
- 通讯作者:Yuntian Deng-;Xingyu Zhou;Baekjin Kim;Ambuj Tewari;Abhishek Gupta;N. Shroff
Learning Mixtures of Markov Chains and MDPs
- DOI:10.48550/arxiv.2211.09403
- 发表时间:2022-11
- 期刊:
- 影响因子:0
- 作者:Chinmaya Kausik;Kevin Tan;Ambuj Tewari
- 通讯作者:Chinmaya Kausik;Kevin Tan;Ambuj Tewari
Efficient Reinforcement Learning with Prior Causal Knowledge
利用先验因果知识进行高效强化学习
- DOI:
- 发表时间:2022
- 期刊:
- 影响因子:0
- 作者:Lu, Yangyi;Meisami, Amirhossein;Tewari, Ambuj
- 通讯作者:Tewari, Ambuj
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Ambuj Tewari其他文献
Online Learning with Set-Valued Feedback
具有设定值反馈的在线学习
- DOI:
- 发表时间:
2023 - 期刊:
- 影响因子:0
- 作者:
Vinod Raman;Unique Subedi;Ambuj Tewari - 通讯作者:
Ambuj Tewari
Perturbation Algorithms for Adversarial Online Learning by Zifan Li Advisor :
Zifan Li 顾问的对抗性在线学习的扰动算法:
- DOI:
- 发表时间:
2017 - 期刊:
- 影响因子:0
- 作者:
Ambuj Tewari - 通讯作者:
Ambuj Tewari
On the Minimax Regret in Online Ranking with Top-k Feedback
论Top-k反馈在线排名中的Minimax遗憾
- DOI:
10.48550/arxiv.2309.02425 - 发表时间:
2023 - 期刊:
- 影响因子:0
- 作者:
Mingyuan Zhang;Ambuj Tewari - 通讯作者:
Ambuj Tewari
Regularized Estimation in High Dimensional Time Series under Mixing Conditions
混合条件下高维时间序列的正则估计
- DOI:
- 发表时间:
2016 - 期刊:
- 影响因子:0
- 作者:
Kam Chung Wong;Ambuj Tewari;Zifan Li - 通讯作者:
Zifan Li
Probabilistically Robust PAC Learning
概率稳健的 PAC 学习
- DOI:
10.48550/arxiv.2211.05656 - 发表时间:
2022 - 期刊:
- 影响因子:0
- 作者:
Vinod Raman;Unique Subedi;Ambuj Tewari - 通讯作者:
Ambuj Tewari
Ambuj Tewari的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Ambuj Tewari', 18)}}的其他基金
Efficient Algorithms with Statistical Guarantees for High Dimensional Time Series
高维时间序列具有统计保证的高效算法
- 批准号:
1612549 - 财政年份:2016
- 资助金额:
$ 45万 - 项目类别:
Standard Grant
CAREER: New Frontiers in Sequential Decision Making with a View Towards Mobile Health Applications
职业:顺序决策的新领域,着眼于移动医疗应用
- 批准号:
1452099 - 财政年份:2015
- 资助金额:
$ 45万 - 项目类别:
Continuing Grant
RI: Small: Collaborative Research: Statistical ranking theory without a canonical loss
RI:小:协作研究:没有典型损失的统计排名理论
- 批准号:
1319810 - 财政年份:2013
- 资助金额:
$ 45万 - 项目类别:
Standard Grant
相似国自然基金
昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
- 批准号:
- 批准年份:2024
- 资助金额:0.0 万元
- 项目类别:省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
- 批准号:
- 批准年份:2022
- 资助金额:10.0 万元
- 项目类别:省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
- 批准号:32000033
- 批准年份:2020
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
- 批准号:31972324
- 批准年份:2019
- 资助金额:58.0 万元
- 项目类别:面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
- 批准号:81900988
- 批准年份:2019
- 资助金额:21.0 万元
- 项目类别:青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
- 批准号:31870821
- 批准年份:2018
- 资助金额:56.0 万元
- 项目类别:面上项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
- 批准号:31802058
- 批准年份:2018
- 资助金额:26.0 万元
- 项目类别:青年科学基金项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
- 批准号:31772128
- 批准年份:2017
- 资助金额:60.0 万元
- 项目类别:面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
- 批准号:81704176
- 批准年份:2017
- 资助金额:20.0 万元
- 项目类别:青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
- 批准号:91640114
- 批准年份:2016
- 资助金额:85.0 万元
- 项目类别:重大研究计划
相似海外基金
AF: Small: Low-Degree Methods for Optimization in Random Structures. Power and Limitations
AF:小:随机结构优化的低度方法。
- 批准号:
2233897 - 财政年份:2023
- 资助金额:
$ 45万 - 项目类别:
Standard Grant
AF: Small: New Tools to Analyze Random Walks
AF:小:分析随机游走的新工具
- 批准号:
2203541 - 财政年份:2022
- 资助金额:
$ 45万 - 项目类别:
Standard Grant
CIF: Small: Timing Optimization Over Random Network Asynchrony - Theory And Distributed Algorithms
CIF:小:随机网络异步的时序优化 - 理论和分布式算法
- 批准号:
2008527 - 财政年份:2020
- 资助金额:
$ 45万 - 项目类别:
Standard Grant
NeTS: Small: Massive Wireless Random Access: Principles and Protocols
NetS:小型:大规模无线随机接入:原理和协议
- 批准号:
1817205 - 财政年份:2018
- 资助金额:
$ 45万 - 项目类别:
Standard Grant
CIF: Small: Information and Coding Theory for Random Access
CIF:小:随机访问的信息和编码理论
- 批准号:
1817241 - 财政年份:2018
- 资助金额:
$ 45万 - 项目类别:
Standard Grant
AF: Small: The Complexity of Random CSPs
AF:小:随机 CSP 的复杂性
- 批准号:
1717606 - 财政年份:2017
- 资助金额:
$ 45万 - 项目类别:
Standard Grant
SaTC: STARSS: Small: Design of Low-Power True Random Number Generator based on Adaptive Post-Processing
SaTC:STARSS:小型:基于自适应后处理的低功耗真随机数生成器设计
- 批准号:
1714496 - 财政年份:2017
- 资助金额:
$ 45万 - 项目类别:
Standard Grant
CIF: Small: Fundamental limits and coding for massive wireless random-access
CIF:小:大规模无线随机访问的基本限制和编码
- 批准号:
1717842 - 财政年份:2017
- 资助金额:
$ 45万 - 项目类别:
Standard Grant
Specification of random effects distributions in mixed-effects models with applications to small area estimation
混合效应模型中随机效应分布的规范及其在小区域估计中的应用
- 批准号:
16H07406 - 财政年份:2016
- 资助金额:
$ 45万 - 项目类别:
Grant-in-Aid for Research Activity Start-up
CIF: Small: Massive Uncoordinated and Sporadic Multiple Access -- Strengthening Connections between Coding and Random Access
CIF:小型:大规模不协调和零星多址——加强编码和随机接入之间的联系
- 批准号:
1619085 - 财政年份:2016
- 资助金额:
$ 45万 - 项目类别:
Standard Grant














{{item.name}}会员




