Devising robust Multi-Armed Bandit algorithms in the presence of non-stationarities and long-range dependencies
在存在非平稳性和远程依赖性的情况下设计稳健的 Multi-Armed Bandit 算法
基本信息
- 批准号:2437073
- 负责人:
- 金额:--
- 依托单位:
- 依托单位国家:英国
- 项目类别:Studentship
- 财政年份:2020
- 资助国家:英国
- 起止时间:2020 至 无数据
- 项目状态:未结题
- 来源:
- 关键词:
项目摘要
The Multi-Armed Bandit (MAB) problem is one of the most central instances of sequential decision making under uncertainty, which plays a key role in online learning and optimization. MABs arise in a variety of modern real-world applications, such as online advertisement, Internet routing, and sequential portfolio selection, only to name a few. In this problem, a forecaster aims to maximize the expected sum of the rewards actively collected from unknown processes. MABs are typically studied under the assumption that the rewards are i.i.d.. However, this assumption does not necessarily hold in many practical situations. The objective of this project is to analyze the possibilities and limitations of more challenging, yet more realistic (restless) MAB settings, where the reward distributions may exhibit long-range dependencies and may possess potential non-stationarities. As part of the project, novel MAB strategies with good performance guarantees will be sought, and applications to real-world problems will be explored.
多臂强盗(MAB)问题是不确定性下连续决策的最中心实例之一,在在线学习和优化中起着关键作用。 mabs出现在各种现代现实世界中,例如在线广告,互联网路由和连续组合选择,仅举几例。在此问题中,预报掌握的目的是最大程度地提高从未知过程中积极收集的奖励的预期总和。通常根据奖励是I.I.D的假设来研究mAb。但是,在许多实际情况下,此假设不一定存在。该项目的目的是分析更具挑战性,更现实(不安的)单元格环境的可能性和局限性,在这种情况下,奖励分布可能会表现出远距离的依赖性并可能具有潜在的非平稳性。作为该项目的一部分,将寻求具有良好性能保证的新型MAB策略,并将探讨对现实世界中问题的应用。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
其他文献
Metal nanoparticles entrapped in metal matrices.
- DOI:
10.1039/d1na00315a - 发表时间:
2021-07-27 - 期刊:
- 影响因子:4.7
- 作者:
- 通讯作者:
Stunting as a Risk Factor of Soil-Transmitted Helminthiasis in Children: A Literature Review.
- DOI:
10.1155/2022/8929025 - 发表时间:
2022 - 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
Aspirin use is associated with decreased inpatient mortality in patients with COVID-19: A meta-analysis.
- DOI:
10.1016/j.ahjo.2022.100191 - 发表时间:
2022-08 - 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
Ged?chtnis und Wissenserwerb [Memory and knowledge acquisition]
- DOI:
10.1007/978-3-662-55754-9_2 - 发表时间:
2019-01-01 - 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
A Holistic Evaluation of CO2 Equivalent Greenhouse Gas Emissions from Compost Reactors with Aeration and Calcium Superphosphate Addition
曝气和添加过磷酸钙的堆肥反应器二氧化碳当量温室气体排放的整体评估
- DOI:
10.3969/j.issn.1674-764x.2010.02.010 - 发表时间:
2010-06 - 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('', 18)}}的其他基金
An implantable biosensor microsystem for real-time measurement of circulating biomarkers
用于实时测量循环生物标志物的植入式生物传感器微系统
- 批准号:
2901954 - 财政年份:2028
- 资助金额:
-- - 项目类别:
Studentship
Exploiting the polysaccharide breakdown capacity of the human gut microbiome to develop environmentally sustainable dishwashing solutions
利用人类肠道微生物群的多糖分解能力来开发环境可持续的洗碗解决方案
- 批准号:
2896097 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
A Robot that Swims Through Granular Materials
可以在颗粒材料中游动的机器人
- 批准号:
2780268 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Likelihood and impact of severe space weather events on the resilience of nuclear power and safeguards monitoring.
严重空间天气事件对核电和保障监督的恢复力的可能性和影响。
- 批准号:
2908918 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Proton, alpha and gamma irradiation assisted stress corrosion cracking: understanding the fuel-stainless steel interface
质子、α 和 γ 辐照辅助应力腐蚀开裂:了解燃料-不锈钢界面
- 批准号:
2908693 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Field Assisted Sintering of Nuclear Fuel Simulants
核燃料模拟物的现场辅助烧结
- 批准号:
2908917 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Assessment of new fatigue capable titanium alloys for aerospace applications
评估用于航空航天应用的新型抗疲劳钛合金
- 批准号:
2879438 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Developing a 3D printed skin model using a Dextran - Collagen hydrogel to analyse the cellular and epigenetic effects of interleukin-17 inhibitors in
使用右旋糖酐-胶原蛋白水凝胶开发 3D 打印皮肤模型,以分析白细胞介素 17 抑制剂的细胞和表观遗传效应
- 批准号:
2890513 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Understanding the interplay between the gut microbiome, behavior and urbanisation in wild birds
了解野生鸟类肠道微生物组、行为和城市化之间的相互作用
- 批准号:
2876993 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
相似国自然基金
强壮前沟藻共生细菌降解膦酸酯产生促藻效应的分子机制
- 批准号:42306167
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
高效率强壮消息鉴别码的分析与设计
- 批准号:61202422
- 批准年份:2012
- 资助金额:23.0 万元
- 项目类别:青年科学基金项目
半定松弛与非凸二次约束二次规划研究
- 批准号:11271243
- 批准年份:2012
- 资助金额:60.0 万元
- 项目类别:面上项目
基于复合编码脉冲串的水下主动隐蔽性探测新方法研究
- 批准号:61271414
- 批准年份:2012
- 资助金额:60.0 万元
- 项目类别:面上项目
民航客运网络收益管理若干问题的研究
- 批准号:60776817
- 批准年份:2007
- 资助金额:20.0 万元
- 项目类别:联合基金项目
相似海外基金
Research on Robust Multi-Person Gait Recognition Based on the Combination of Human Mesh Model and Silhouette
基于人体网格模型与剪影相结合的鲁棒多人步态识别研究
- 批准号:
24K20794 - 财政年份:2024
- 资助金额:
-- - 项目类别:
Grant-in-Aid for Early-Career Scientists
CPS: Medium: Collaborative Research: Provably Safe and Robust Multi-Agent Reinforcement Learning with Applications in Urban Air Mobility
CPS:中:协作研究:可证明安全且鲁棒的多智能体强化学习及其在城市空中交通中的应用
- 批准号:
2312092 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Standard Grant
Unified Robust Control System Design for Regional Multi-Energy Systems Based on Multi-Dimensional Systems and Dissipativity
基于多维系统和耗散性的区域多能源系统统一鲁棒控制系统设计
- 批准号:
23K03910 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Grant-in-Aid for Scientific Research (C)
Bayesian Statistical Learning for Robust and Generalizable Causal Inferences in Alzheimer Disease and Related Disorders Research
贝叶斯统计学习在阿尔茨海默病和相关疾病研究中进行稳健且可推广的因果推论
- 批准号:
10590913 - 财政年份:2023
- 资助金额:
-- - 项目类别:
NAVIGATE Kidney: A Multi-Level Intervention to Reduce Kidney Health Disparities
NAVIGATE Kidney:减少肾脏健康差异的多层次干预措施
- 批准号:
10742130 - 财政年份:2023
- 资助金额:
-- - 项目类别: