AF: Small: Optimization Algorithms for Multi-Armed Bandit Problems
AF:小:多臂老虎机问题的优化算法
基本信息
- 批准号:1117216
- 负责人:
- 金额:$ 38万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2011
- 资助国家:美国
- 起止时间:2011-09-01 至 2015-08-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
Computation in many emerging applications, such as online advertising and large scale social, media or sensor networks, is increasingly moving away from a simplistic view of computing a fixed function on a well defined input. Increasingly we are realizing that the input and the function are only the means to an end; and are inexact and imprecise at best. In many of these applications, the cost of realizing the input, in possibly distributed and dynamic/interactive environments, is a significant fraction of the cost of the computation itself. The emerging theme has been (i) to formulate models (very often probabilistic) of the input, (ii) precompute strategies that probe or realize few pieces of the input, and (iii) execute the strategies while making small adjustments as the data is incrementally made available. Moreover all these three stages are interleaved and the optimization is often repetitive. The overall process corresponds to repeatedly adapting to the short run behavior of the input which is reset often, starting from an initial and aggregate model of the long term behavior. Thus the task is to design and analyze algorithms that span and adapt to multiple scales of time.Similar problems which encode the tradeoffs between exploration and exploitation has classically been modeled by the Multi-Armed Bandit problem, where the arms correspond to the available choices. However, these emerging domains differ in several critical aspects. This proposal seeks to extend the optimization and analysis of Multi-Armed Bandit problems in a number of novel dimensions, specifically in terms of nonlinear and subadditive objective functions, noisy and error-prone feedbacks, lack of centrality and entangled feedbacks, implementation barriers of budgets or policies, and dynamic behavior. These extensions are connected, and progress on these problems would lead to a wealth of new results and more importantly, new techniques, in optimization as well as in bandit literature.In addition to the development of new algorithmic and analysis ideas, the proposal would train graduate students to develop simultaneous expertise in theoretical computer science, machine learning and statistics, as well as stochastic control. Moreover the crosscutting aspect of the research would be disseminated through tutorials, surveys and monographs.
在许多新兴应用中,如在线广告和大规模社交、媒体或传感器网络,计算正日益远离在定义明确的输入上计算固定函数的简单化观点。我们越来越意识到,输入和功能只是达到目的的手段;充其量也是不准确和不精确的。在许多这样的应用中,在可能的分布式和动态/交互环境中实现输入的成本是计算本身成本的很大一部分。新出现的主题是(I)制定投入的模型(往往是概率的),(Ii)探索或实现少量投入的预先计算战略,以及(Iii)随着数据的逐步提供而执行战略,同时进行小的调整。而且,这三个阶段都是交错的,优化往往是重复的。整个过程对应于反复适应经常重置的输入的短期行为,从长期行为的初始和聚合模型开始。因此,任务是设计和分析跨越并适应多个时间尺度的算法。类似的问题编码了勘探和开发之间的权衡,经典地由多臂强盗问题建模,其中臂对应于可用选择。然而,这些新兴领域在几个关键方面有所不同。这一建议试图在一些新的维度上扩展对多臂强盗问题的优化和分析,特别是在非线性和次可加性目标函数、噪声和容易出错的反馈、缺乏中心性和纠缠反馈、预算或政策的实施障碍和动态行为方面。这些扩展是相互关联的,在这些问题上的进展将导致大量的新结果,更重要的是,在优化和盗贼文献方面的新技术。除了开发新的算法和分析思想外,该提案还将培养研究生在理论计算机科学、机器学习和统计学以及随机控制方面同时发展专业知识。此外,研究的交叉方面将通过教程、调查和专著加以传播。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Sudipto Guha其他文献
On the space–time of optimal, approximate and streaming algorithms for synopsis construction problems
- DOI:
10.1007/s00778-007-0083-9 - 发表时间:
2007-12-13 - 期刊:
- 影响因子:3.800
- 作者:
Sudipto Guha - 通讯作者:
Sudipto Guha
A Constant Factor Approximation for the Single Sink Edge Installation Problem ∗
单水槽边缘安装问题的常数因子近似*
- DOI:
- 发表时间:
2008 - 期刊:
- 影响因子:0
- 作者:
Sudipto Guha;Adam Meyerson;Kamesh Munagala - 通讯作者:
Kamesh Munagala
Wavelet synopsis for hierarchical range queries with workloads
- DOI:
10.1007/s00778-007-0052-3 - 发表时间:
2007-09-14 - 期刊:
- 影响因子:3.800
- 作者:
Sudipto Guha;Hyoungmin Park;Kyuseok Shim - 通讯作者:
Kyuseok Shim
Facility Location with Dynamic Distance Functions
- DOI:
10.1023/a:1009796525600 - 发表时间:
1998-09-01 - 期刊:
- 影响因子:1.100
- 作者:
Randeep Bhatia;Sudipto Guha;Samir Khuller;Yoram J. Sussmann - 通讯作者:
Yoram J. Sussmann
Sudipto Guha的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Sudipto Guha', 18)}}的其他基金
BIGDATA: F: Graph Sketching and Optimization Problems
BIGDATA:F:图形绘制和优化问题
- 批准号:
1546151 - 财政年份:2015
- 资助金额:
$ 38万 - 项目类别:
Standard Grant
CAREER: Information, Optimization and Approximation
职业:信息、优化和近似
- 批准号:
0644119 - 财政年份:2007
- 资助金额:
$ 38万 - 项目类别:
Continuing Grant
Approximation Algorithms for Data Streams
数据流的近似算法
- 批准号:
0430376 - 财政年份:2004
- 资助金额:
$ 38万 - 项目类别:
Continuing Grant
相似国自然基金
昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
- 批准号:
- 批准年份:2024
- 资助金额:0.0 万元
- 项目类别:省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
- 批准号:n/a
- 批准年份:2022
- 资助金额:10.0 万元
- 项目类别:省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
- 批准号:32000033
- 批准年份:2020
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
- 批准号:31972324
- 批准年份:2019
- 资助金额:58.0 万元
- 项目类别:面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
- 批准号:81900988
- 批准年份:2019
- 资助金额:21.0 万元
- 项目类别:青年科学基金项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
- 批准号:31802058
- 批准年份:2018
- 资助金额:26.0 万元
- 项目类别:青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
- 批准号:31870821
- 批准年份:2018
- 资助金额:56.0 万元
- 项目类别:面上项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
- 批准号:31772128
- 批准年份:2017
- 资助金额:60.0 万元
- 项目类别:面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
- 批准号:81704176
- 批准年份:2017
- 资助金额:20.0 万元
- 项目类别:青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
- 批准号:91640114
- 批准年份:2016
- 资助金额:85.0 万元
- 项目类别:重大研究计划
相似海外基金
Collaborative Research: AF: Small: New Connections between Optimization and Property Testing
合作研究:AF:小型:优化和性能测试之间的新联系
- 批准号:
2402572 - 财政年份:2024
- 资助金额:
$ 38万 - 项目类别:
Standard Grant
AF: Small: Memory Bounded Optimization and Learning
AF:小:内存限制优化和学习
- 批准号:
2341890 - 财政年份:2024
- 资助金额:
$ 38万 - 项目类别:
Standard Grant
Collaborative Research: AF: Small: New Connections between Optimization and Property Testing
合作研究:AF:小型:优化和性能测试之间的新联系
- 批准号:
2402571 - 财政年份:2024
- 资助金额:
$ 38万 - 项目类别:
Standard Grant
AF: Small: Advances in Private Optimization
AF:小:私人优化的进展
- 批准号:
2211718 - 财政年份:2023
- 资助金额:
$ 38万 - 项目类别:
Standard Grant
Collaborative Research: AF: Small: Sampling and Optimization under Global Constraints
合作研究:AF:小型:全局约束下的采样和优化
- 批准号:
2309708 - 财政年份:2023
- 资助金额:
$ 38万 - 项目类别:
Standard Grant
AF: Small: Low-Degree Methods for Optimization in Random Structures. Power and Limitations
AF:小:随机结构优化的低度方法。
- 批准号:
2233897 - 财政年份:2023
- 资助金额:
$ 38万 - 项目类别:
Standard Grant
NSF-BSF: AF: Small: Parameter-Free Stochastic Optimization via Trajectory Cues
NSF-BSF:AF:小:通过轨迹线索进行无参数随机优化
- 批准号:
2239527 - 财政年份:2023
- 资助金额:
$ 38万 - 项目类别:
Standard Grant
Collaborative Research: AF: Small: Sampling and Optimization under Global Constraints
合作研究:AF:小型:全局约束下的采样和优化
- 批准号:
2309707 - 财政年份:2023
- 资助金额:
$ 38万 - 项目类别:
Standard Grant
AF: Small: Bridging the Past and Present of Continuous Optimization for Learning
AF:小:连接持续优化学习的过去和现在
- 批准号:
2224213 - 财政年份:2022
- 资助金额:
$ 38万 - 项目类别:
Standard Grant
Collaborative Research: AF: Small: A Unified Framework for Analyzing Adaptive Stochastic Optimization Methods Based on Probabilistic Oracles
合作研究:AF:Small:基于概率预言的自适应随机优化方法分析统一框架
- 批准号:
2139735 - 财政年份:2022
- 资助金额:
$ 38万 - 项目类别:
Standard Grant