Devising robust Multi-Armed Bandit algorithms in the presence of non-stationarities and long-range dependencies
在存在非平稳性和远程依赖性的情况下设计稳健的 Multi-Armed Bandit 算法
基本信息
- 批准号:2437073
- 负责人:
- 金额:--
- 依托单位:
- 依托单位国家:英国
- 项目类别:Studentship
- 财政年份:2020
- 资助国家:英国
- 起止时间:2020 至 无数据
- 项目状态:未结题
- 来源:
- 关键词:
项目摘要
The Multi-Armed Bandit (MAB) problem is one of the most central instances of sequential decision making under uncertainty, which plays a key role in online learning and optimization. MABs arise in a variety of modern real-world applications, such as online advertisement, Internet routing, and sequential portfolio selection, only to name a few. In this problem, a forecaster aims to maximize the expected sum of the rewards actively collected from unknown processes. MABs are typically studied under the assumption that the rewards are i.i.d.. However, this assumption does not necessarily hold in many practical situations. The objective of this project is to analyze the possibilities and limitations of more challenging, yet more realistic (restless) MAB settings, where the reward distributions may exhibit long-range dependencies and may possess potential non-stationarities. As part of the project, novel MAB strategies with good performance guarantees will be sought, and applications to real-world problems will be explored.
多臂强盗(MAB)问题是不确定条件下序贯决策问题中最核心的问题之一,在在线学习和优化中起着关键作用。MAB出现在各种现代现实世界的应用中,例如在线广告,互联网路由和顺序投资组合选择,仅举几例。在这个问题中,预测者的目标是最大化从未知过程中积极收集的奖励的预期总和。MAB通常在假设奖励是独立同分布的情况下进行研究。然而,这一假设在许多实际情况下并不一定成立。该项目的目标是分析更具挑战性,但更现实(不安)的MAB设置的可能性和局限性,其中奖励分布可能表现出长期依赖性,并可能具有潜在的非平稳性。作为该项目的一部分,将寻求具有良好性能保证的新型MAB策略,并将探索实际问题的应用。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
其他文献
吉治仁志 他: "トランスジェニックマウスによるTIMP-1の線維化促進機序"最新医学. 55. 1781-1787 (2000)
Hitoshi Yoshiji 等:“转基因小鼠中 TIMP-1 的促纤维化机制”现代医学 55. 1781-1787 (2000)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
LiDAR Implementations for Autonomous Vehicle Applications
- DOI:
- 发表时间:
2021 - 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
吉治仁志 他: "イラスト医学&サイエンスシリーズ血管の分子医学"羊土社(渋谷正史編). 125 (2000)
Hitoshi Yoshiji 等人:“血管医学与科学系列分子医学图解”Yodosha(涉谷正志编辑)125(2000)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
Effect of manidipine hydrochloride,a calcium antagonist,on isoproterenol-induced left ventricular hypertrophy: "Yoshiyama,M.,Takeuchi,K.,Kim,S.,Hanatani,A.,Omura,T.,Toda,I.,Akioka,K.,Teragaki,M.,Iwao,H.and Yoshikawa,J." Jpn Circ J. 62(1). 47-52 (1998)
钙拮抗剂盐酸马尼地平对异丙肾上腺素引起的左心室肥厚的影响:“Yoshiyama,M.,Takeuchi,K.,Kim,S.,Hanatani,A.,Omura,T.,Toda,I.,Akioka,
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('', 18)}}的其他基金
An implantable biosensor microsystem for real-time measurement of circulating biomarkers
用于实时测量循环生物标志物的植入式生物传感器微系统
- 批准号:
2901954 - 财政年份:2028
- 资助金额:
-- - 项目类别:
Studentship
Exploiting the polysaccharide breakdown capacity of the human gut microbiome to develop environmentally sustainable dishwashing solutions
利用人类肠道微生物群的多糖分解能力来开发环境可持续的洗碗解决方案
- 批准号:
2896097 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
A Robot that Swims Through Granular Materials
可以在颗粒材料中游动的机器人
- 批准号:
2780268 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Likelihood and impact of severe space weather events on the resilience of nuclear power and safeguards monitoring.
严重空间天气事件对核电和保障监督的恢复力的可能性和影响。
- 批准号:
2908918 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Proton, alpha and gamma irradiation assisted stress corrosion cracking: understanding the fuel-stainless steel interface
质子、α 和 γ 辐照辅助应力腐蚀开裂:了解燃料-不锈钢界面
- 批准号:
2908693 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Field Assisted Sintering of Nuclear Fuel Simulants
核燃料模拟物的现场辅助烧结
- 批准号:
2908917 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Assessment of new fatigue capable titanium alloys for aerospace applications
评估用于航空航天应用的新型抗疲劳钛合金
- 批准号:
2879438 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Developing a 3D printed skin model using a Dextran - Collagen hydrogel to analyse the cellular and epigenetic effects of interleukin-17 inhibitors in
使用右旋糖酐-胶原蛋白水凝胶开发 3D 打印皮肤模型,以分析白细胞介素 17 抑制剂的细胞和表观遗传效应
- 批准号:
2890513 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Understanding the interplay between the gut microbiome, behavior and urbanisation in wild birds
了解野生鸟类肠道微生物组、行为和城市化之间的相互作用
- 批准号:
2876993 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
相似国自然基金
半定松弛与非凸二次约束二次规划研究
- 批准号:11271243
- 批准年份:2012
- 资助金额:60.0 万元
- 项目类别:面上项目
基于复合编码脉冲串的水下主动隐蔽性探测新方法研究
- 批准号:61271414
- 批准年份:2012
- 资助金额:60.0 万元
- 项目类别:面上项目
民航客运网络收益管理若干问题的研究
- 批准号:60776817
- 批准年份:2007
- 资助金额:20.0 万元
- 项目类别:联合基金项目
供应链管理中的稳健型(Robust)策略分析和稳健型优化(Robust Optimization )方法研究
- 批准号:70601028
- 批准年份:2006
- 资助金额:7.0 万元
- 项目类别:青年科学基金项目
心理紧张和应力影响下Robust语音识别方法研究
- 批准号:60085001
- 批准年份:2000
- 资助金额:14.0 万元
- 项目类别:专项基金项目
ROBUST语音识别方法的研究
- 批准号:69075008
- 批准年份:1990
- 资助金额:3.5 万元
- 项目类别:面上项目
改进型ROBUST序贯检测技术
- 批准号:68671030
- 批准年份:1986
- 资助金额:2.0 万元
- 项目类别:面上项目
相似海外基金
Research on Robust Multi-Person Gait Recognition Based on the Combination of Human Mesh Model and Silhouette
基于人体网格模型与剪影相结合的鲁棒多人步态识别研究
- 批准号:
24K20794 - 财政年份:2024
- 资助金额:
-- - 项目类别:
Grant-in-Aid for Early-Career Scientists
CPS: Medium: Collaborative Research: Provably Safe and Robust Multi-Agent Reinforcement Learning with Applications in Urban Air Mobility
CPS:中:协作研究:可证明安全且鲁棒的多智能体强化学习及其在城市空中交通中的应用
- 批准号:
2312092 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Standard Grant
Unified Robust Control System Design for Regional Multi-Energy Systems Based on Multi-Dimensional Systems and Dissipativity
基于多维系统和耗散性的区域多能源系统统一鲁棒控制系统设计
- 批准号:
23K03910 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Grant-in-Aid for Scientific Research (C)
NAVIGATE Kidney: A Multi-Level Intervention to Reduce Kidney Health Disparities
NAVIGATE Kidney:减少肾脏健康差异的多层次干预措施
- 批准号:
10742130 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Collaborative Research: III: Small: Efficient and Robust Multi-model Data Analytics for Edge Computing
协作研究:III:小型:边缘计算的高效、稳健的多模型数据分析
- 批准号:
2311596 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Standard Grant
Collaborative Research: III: Small: Efficient and Robust Multi-model Data Analytics for Edge Computing
协作研究:III:小型:边缘计算的高效、稳健的多模型数据分析
- 批准号:
2311598 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Standard Grant
Robust Multi-Robot Path Planning and Execution on a Large Scale
大规模鲁棒多机器人路径规划和执行
- 批准号:
2328671 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Standard Grant
An Explainable Unified AI Strategy for Efficient and Robust Integrative Analysis of Multi-omics Data from Highly Heterogeneous Multiple Studies
一种可解释的统一人工智能策略,用于对来自高度异质性多项研究的多组学数据进行高效、稳健的综合分析
- 批准号:
10729965 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Collaborative Research: SaTC: CORE: Small: Secure and Robust Machine Learning in Multi-Tenant Cloud FPGA
协作研究:SaTC:CORE:小型:多租户云 FPGA 中安全且稳健的机器学习
- 批准号:
2411207 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Standard Grant