Stochastic optimal control constrained by costly observations

受昂贵观测约束的随机最优控制

基本信息

  • 批准号:
    2269738
  • 负责人:
  • 金额:
    --
  • 依托单位:
  • 依托单位国家:
    英国
  • 项目类别:
    Studentship
  • 财政年份:
    2019
  • 资助国家:
    英国
  • 起止时间:
    2019 至 无数据
  • 项目状态:
    已结题

项目摘要

Stochastic control is an important tool that incorporates the effect of randomness in decision-making. It is useful as a mathematical model in applications and is often employed in areas of mathematical finance and resource management. The main aim of our project is the mathematical analysis of variants of stochastic control that involves costly observations, through a combination of analytical, numerical and computational approaches. Our model assumes that access to the underlying state requires a strictly positive cost. This amounts to an optimisation problem that involves a trade off between cost and information. Although this falls under the partial information setting, this differs from the filtering problem, where a function of the underlying state is accessible to the user at all times. The trade off between cost and information can be commonly seen in instances of maintenance, environmental restoration and hospital treatment problems, where measurements or records are expensive and are not continuously observed. It can also be seen as a variant of exploration versus exploitation, a theme which is prevalent in research areas of bandit theory and reinforcement learning. We find the amount of literature exploring the above aspects limited, and the mathematical framework has yet to be established in full generality. In our work we first consider a discrete-time Markov chain model as a starting point and provide a simple analysis on a toy problem for intuition. The Markov chain construction provides us with a possible discretisation scheme for numerical approximation in the continuous case. We then move on to the general continuous-time setting, deriving a variational PDE for the value function via the dynamic programming principle. This approach is in analogy to the classical full information case and we hope to draw parallels between the two cases. In particular we expect the variational PDE to converge towards the classical HJB equation as the observation cost tends towards zero and we would like to establish this rate of convergence. Due to the positive observation cost, extra integral terms are present in the variational PDE which adds a layer of complexity when numerically solving for the PDE. The search of a computationally efficient numerical scheme will be one of the focuses of the project in the future. In particular the use of neural networks could provide a potential pathway to overcoming the curse of dimensionality. Further avenues of investigation could involve analysis of additional constraints in the model, for example the incorporation of time-delayed executions. This project falls within the EPSRC Mathematics Analysis, Numerical Analysis, Statistics and Applied Probability, and Operational Research research areas.
随机控制是一种重要的工具,它将随机性的影响纳入决策。它在应用中作为数学模型很有用,并且经常在数学金融和资源管理领域中使用。我们项目的主要目的是通过分析,数值和计算方法的结合,对涉及昂贵观测的随机控制变体进行数学分析。我们的模型假设进入底层状态需要严格的正成本。这相当于一个优化问题,涉及成本和信息之间的权衡。虽然这福尔斯属于部分信息设置,但这与过滤问题不同,在过滤问题中,用户始终可以访问底层状态的函数。在维护、环境恢复和医院治疗问题的情况下,通常可以看到成本和信息之间的权衡,在这些情况下,测量或记录是昂贵的,并且没有持续观察。它也可以被看作是探索与剥削的一种变体,这是一个在强盗理论和强化学习研究领域中普遍存在的主题。 我们发现,探讨上述方面的文献数量有限,数学框架尚未建立在充分的普遍性。在我们的工作中,我们首先考虑一个离散时间马尔可夫链模型作为出发点,并提供一个简单的分析玩具问题的直觉。马尔可夫链的建设为我们提供了一个可能的离散化方案的数值逼近连续的情况下。然后,我们移动到一般的连续时间设置,通过动态规划原理导出值函数的变分偏微分方程。这种方法类似于经典的完全信息的情况下,我们希望这两种情况之间的相似之处。特别是,当观察成本趋于零时,我们期望变分偏微分方程收敛于经典的HJB方程,并且我们希望建立这种收敛速度。由于正的观测成本,额外的积分项存在于变分偏微分方程中,这增加了一层的复杂性时,数值求解偏微分方程。寻找一种计算效率高的数值格式将是该项目未来的重点之一。特别是神经网络的使用可以提供一个潜在的途径来克服维数灾难。进一步的调查途径可包括分析该模式中的其他限制因素,例如纳入延迟处决。该项目属于EPSRC数学分析、数值分析、统计和应用概率以及运筹学研究领域的福尔斯。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

其他文献

Internet-administered, low-intensity cognitive behavioral therapy for parents of children treated for cancer: A feasibility trial (ENGAGE).
针对癌症儿童父母的互联网管理、低强度认知行为疗法:可行性试验 (ENGAGE)。
  • DOI:
    10.1002/cam4.5377
  • 发表时间:
    2023-03
  • 期刊:
  • 影响因子:
    4
  • 作者:
  • 通讯作者:
Differences in child and adolescent exposure to unhealthy food and beverage advertising on television in a self-regulatory environment.
在自我监管的环境中,儿童和青少年在电视上接触不健康食品和饮料广告的情况存在差异。
  • DOI:
    10.1186/s12889-023-15027-w
  • 发表时间:
    2023-03-23
  • 期刊:
  • 影响因子:
    4.5
  • 作者:
  • 通讯作者:
The association between rheumatoid arthritis and reduced estimated cardiorespiratory fitness is mediated by physical symptoms and negative emotions: a cross-sectional study.
类风湿性关节炎与估计心肺健康降低之间的关联是由身体症状和负面情绪介导的:一项横断面研究。
  • DOI:
    10.1007/s10067-023-06584-x
  • 发表时间:
    2023-07
  • 期刊:
  • 影响因子:
    3.4
  • 作者:
  • 通讯作者:
ElasticBLAST: accelerating sequence search via cloud computing.
ElasticBLAST:通过云计算加速序列搜索。
  • DOI:
    10.1186/s12859-023-05245-9
  • 发表时间:
    2023-03-26
  • 期刊:
  • 影响因子:
    3
  • 作者:
  • 通讯作者:
Amplified EQCM-D detection of extracellular vesicles using 2D gold nanostructured arrays fabricated by block copolymer self-assembly.
使用通过嵌段共聚物自组装制造的 2D 金纳米结构阵列放大 EQCM-D 检测细胞外囊泡。
  • DOI:
    10.1039/d2nh00424k
  • 发表时间:
    2023-03-27
  • 期刊:
  • 影响因子:
    9.7
  • 作者:
  • 通讯作者:

的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('', 18)}}的其他基金

An implantable biosensor microsystem for real-time measurement of circulating biomarkers
用于实时测量循环生物标志物的植入式生物传感器微系统
  • 批准号:
    2901954
  • 财政年份:
    2028
  • 资助金额:
    --
  • 项目类别:
    Studentship
Exploiting the polysaccharide breakdown capacity of the human gut microbiome to develop environmentally sustainable dishwashing solutions
利用人类肠道微生物群的多糖分解能力来开发环境可持续的洗碗解决方案
  • 批准号:
    2896097
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
A Robot that Swims Through Granular Materials
可以在颗粒材料中游动的机器人
  • 批准号:
    2780268
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
Likelihood and impact of severe space weather events on the resilience of nuclear power and safeguards monitoring.
严重空间天气事件对核电和保障监督的恢复力的可能性和影响。
  • 批准号:
    2908918
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
Proton, alpha and gamma irradiation assisted stress corrosion cracking: understanding the fuel-stainless steel interface
质子、α 和 γ 辐照辅助应力腐蚀开裂:了解燃料-不锈钢界面
  • 批准号:
    2908693
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
Field Assisted Sintering of Nuclear Fuel Simulants
核燃料模拟物的现场辅助烧结
  • 批准号:
    2908917
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
Assessment of new fatigue capable titanium alloys for aerospace applications
评估用于航空航天应用的新型抗疲劳钛合金
  • 批准号:
    2879438
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
Developing a 3D printed skin model using a Dextran - Collagen hydrogel to analyse the cellular and epigenetic effects of interleukin-17 inhibitors in
使用右旋糖酐-胶原蛋白水凝胶开发 3D 打印皮肤模型,以分析白细胞介素 17 抑制剂的细胞和表观遗传效应
  • 批准号:
    2890513
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
CDT year 1 so TBC in Oct 2024
CDT 第 1 年,预计 2024 年 10 月
  • 批准号:
    2879865
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
Understanding the interplay between the gut microbiome, behavior and urbanisation in wild birds
了解野生鸟类肠道微生物组、行为和城市化之间的相互作用
  • 批准号:
    2876993
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship

相似国自然基金

基于贝叶斯网络可靠度演进模型的城市雨水管网整体优化设计理论研究
  • 批准号:
    51008191
  • 批准年份:
    2010
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
最优证券设计及完善中国资本市场的路径选择
  • 批准号:
    70873012
  • 批准年份:
    2008
  • 资助金额:
    27.0 万元
  • 项目类别:
    面上项目
慢性阻塞性肺病机械通气时最佳呼气末正压的生理学研究
  • 批准号:
    30770952
  • 批准年份:
    2007
  • 资助金额:
    18.0 万元
  • 项目类别:
    面上项目

相似海外基金

Stochastic optimal control problems in risk management
风险管理中的随机最优控制问题
  • 批准号:
    RGPIN-2020-04338
  • 财政年份:
    2022
  • 资助金额:
    --
  • 项目类别:
    Discovery Grants Program - Individual
Using stochastic optimal feedback control and computational motor control to design personalized and adaptive human robot interfaces
使用随机最优反馈控制和计算电机控制来设计个性化和自适应人类机器人界面
  • 批准号:
    RGPIN-2021-02625
  • 财政年份:
    2022
  • 资助金额:
    --
  • 项目类别:
    Discovery Grants Program - Individual
Stochastic optimal control in mathematical finance
数学金融中的随机最优控制
  • 批准号:
    RGPIN-2018-03978
  • 财政年份:
    2022
  • 资助金额:
    --
  • 项目类别:
    Discovery Grants Program - Individual
Using stochastic optimal feedback control and computational motor control to design personalized and adaptive human robot interfaces
使用随机最优反馈控制和计算电机控制来设计个性化和自适应人类机器人界面
  • 批准号:
    RGPIN-2021-02625
  • 财政年份:
    2021
  • 资助金额:
    --
  • 项目类别:
    Discovery Grants Program - Individual
Stochastic optimal control in mathematical finance
数学金融中的随机最优控制
  • 批准号:
    RGPIN-2018-03978
  • 财政年份:
    2021
  • 资助金额:
    --
  • 项目类别:
    Discovery Grants Program - Individual
Stochastic Optimal Control with High Dimensional Data
高维数据的随机最优控制
  • 批准号:
    2106462
  • 财政年份:
    2021
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
Stochastic Optimal Control of Unmanned Aerial Vehicles Against Cyber Attacks in the Presence of Uncertainty
存在不确定性的情况下无人机抵御网络攻击的随机最优控制
  • 批准号:
    21K14351
  • 财政年份:
    2021
  • 资助金额:
    --
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
Stochastic optimal control problems in risk management
风险管理中的随机最优控制问题
  • 批准号:
    RGPIN-2020-04338
  • 财政年份:
    2021
  • 资助金额:
    --
  • 项目类别:
    Discovery Grants Program - Individual
A data driven approach for optimal stochastic control in finance
金融领域最优随机控制的数据驱动方法
  • 批准号:
    530985-2018
  • 财政年份:
    2020
  • 资助金额:
    --
  • 项目类别:
    Collaborative Research and Development Grants
Stochastic control and optimal stopping models for risk management
风险管理的随机控制和最优停止模型
  • 批准号:
    2431337
  • 财政年份:
    2020
  • 资助金额:
    --
  • 项目类别:
    Studentship
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了