確率的多段決定過程における期待効用と危険度の最適化に関する研究

随机多阶段决策过程中期望效用与风险优化研究

基本信息

  • 批准号:
    07640307
  • 负责人:
  • 金额:
    $ 0.83万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for General Scientific Research (C)
  • 财政年份:
    1995
  • 资助国家:
    日本
  • 起止时间:
    1995 至 无数据
  • 项目状态:
    已结题

项目摘要

マルコフ決定過程(S,A,qij(a),r(i,a))と効用関数gについて,present value βの期待効用に関する最適政策の存在と最適方程式に関する研究が,昨年までに行われていた.本年度は次の結果を得た.1.状態空間Sは可算集合,gはBorel可測,各時点t=0,1,2,・・・で停止すれば利得r(i)を得,続行すればcだけ失うとする.時刻t+1以後において最適に停止する期待効用よりも時刻tで停止した方が良い状態の集合を定義してS^*_t{g}で表し,σ^*を,初めてS^*_t{g}に入った時点で停止するstopping timeとする.(1)σ^*がg-最適stopping timeになるための十分条件を得た.(2)時刻t+1において停止する期待効用よりも時刻tで停止した方が良い状態の集合を,S_t{g}で表し,σを,初めてS_t{g}に入った時点で停止する(OLA)stopping timeとする.{S_t{g}}が状態推移に関してclosedならば,σ=σ^*となる.2.状態空間は有限,効用関数gは狭義単調増加とする.risk premium ρ^π_i(β)=E^π_i(β)-g^<-1>(E^π_i(g(β)))に対して,マルコフ決定過程のutility deviationを,present value β,政策π,初期状態iについて,k^π_i=E^π_i{g(β)}-g(E^π_i(β))と定義する.政策に対応した分布の集合上のoperator Tをうまく定義すると,k^π=(k^π_i;i∈S)に関するベクトル方程式k^π=g_i+Σ_<j∈S>qij(π)k^π(T^i(F^π)j)を得る.risk premiumの再帰式は大変複雑であるが,これを使ってrisk premiumが研究できる.例えば,期待利得最大の下でのrisk premium最小化問題については,Σ_<j∈S>qij(a)<1のときに最適政策が存在するための十分条件と,最適方程式が見つかった.
Present value β expects to use the most efficient policy to determine the existence of the most accurate equation. Last year, the most accurate equation was used last year. The results of this year's annual results are very low. 1. The status space can be counted as a collection, g Borel can be counted, and at each point of time, there is a profit r (I) gain. In the future, please do not expect to use this time to stop the good status collection to define the table S^ * _ t {g}, σ ^. The initial date S^ * _ t {g} has entered the timeframe to stop the stopping time failure. (1) σ ^ * g-the most expensive stopping time condition is satisfactory. (2) it is expected to stop the collection of good party status at the last minute, please do not use this time to stop the customer status collection, set the table, σ. In the beginning, S _ t {g} entered the OLA stopping time at the same time. {S _ t {g}} the state has changed, σ = σ ^ * normal. 2. The state space is limited. Risk premium ρ ^ π _ I (β) = E ^ π _ I (β)-g ^ & lt;-1> (E ^ π _ I (g (β) is used to determine the process of utility deviation, present value β, policy π, initial status, k ^ π _ I = E ^ π _ I {g (β)}-g (E ^ π _ I (β)). The equation k^ π = (k ^ π _ I; I ∈ S) is defined on the operator T distribution set of policy statistics. The equation k^ π = Globi + Σ _ & lt; j ∈ S & gt;qij (π) k ^ π (T ^ I (F ^ π) j) is obtained. The risk premium formula makes a copy of the risk premium. For example, it is expected to maximize the benefit of the risk premium minimization problem, Σ _ & lt; j ∈ S & gt;qij (a) & lt;1 optimal policy exists under the condition that there is a limit of 10%, and the equation is simple.

项目成果

期刊论文数量(12)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Seiichi Fukui: "α-convex functions of β." Proc.of third finite and infinite dimensional complex analysis. 169-172 (1995)
Seiichi Fukui:“β 的 α 凸函数。”Proc。169-172 (1995)
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Hideki Endo: "Correspondence analysis of an artificial bynary cylinder data." Statistics and probability letters.25. 231-240 (1995)
Hideki Endo:“人工二元圆柱体数据的对应分析。”
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Yoshinobu Kadota 他2名: "Utility-optimal stopping in a denumerable Markov chain." Bulletin of informatics and cybernetics. 28(to appear). (1996)
Yoshinobu Kadota 和其他 2 人:“可数马尔可夫链中的效用最优停止。”信息学和控制论通报 28(待出版)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Kaoru Morisugi 他2名: "Self maps of spaces." Proc.J.Math.Soc.(to appear). (1996)
Kaoru Morisugi 和另外 2 人:“空间的自映射”(Proc.J.Math.Soc.)(1996 年)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Y.Iwanaga and H.Sato: "On Auslander's n-Gorenstein rings." Journal of pure and applied algebra. 106. 61-76 (1996)
Y.Iwanaga 和 H.Sato:“关于 Auslander 的 n-Gorenstein 戒指。”
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

門田 良信其他文献

Fuzzy stopping problems in continuous-time fuzzy stochastic systems
连续时间模糊随机系统中的模糊停止问题
  • DOI:
  • 发表时间:
    2003
  • 期刊:
  • 影响因子:
    0
  • 作者:
    門田 良信;蔵野正美(共著);吉田祐治(共著)
  • 通讯作者:
    吉田祐治(共著)
Regret-optimality equation in semi-MDPs with an absorbing set
具有吸收集的半 MDP 中的遗憾最优方程
DISCOUNTED MARKOV DECISION PROCESSES WITH GENERAL UTILITY FUNCTIONS(Optimization Theory and its Applications in Mathematical Systems)
具有一般效用函数的贴现马尔可夫决策过程(最优化理论及其在数学系统中的应用)
  • DOI:
  • 发表时间:
    1995
  • 期刊:
  • 影响因子:
    0
  • 作者:
    門田 良信;蔵野 正美;安田 正実
  • 通讯作者:
    安田 正実

門田 良信的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('門田 良信', 18)}}的其他基金

マルコフ決定過程における分散および期待効用に関する最適化の研究
马尔可夫决策过程中方差与期望效用的优化研究
  • 批准号:
    08640284
  • 财政年份:
    1996
  • 资助金额:
    $ 0.83万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)

相似海外基金

Doctoral Dissertation Research in DRMS - The Predictive Power of Beliefs: Testing a Norm-Based Utility Function
DRMS 博士论文研究 - 信念的预测能力:测试基于规范的效用函数
  • 批准号:
    1459208
  • 财政年份:
    2015
  • 资助金额:
    $ 0.83万
  • 项目类别:
    Standard Grant
Macroeconomic Policy Analysis using utility function with non-constant discount factor
使用具有非恒定贴现因子的效用函数进行宏观经济政策分析
  • 批准号:
    21530277
  • 财政年份:
    2009
  • 资助金额:
    $ 0.83万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Studies on Online Optimization Problems with the Concept of Utility Function
基于效用函数概念的在线优化问题研究
  • 批准号:
    19700015
  • 财政年份:
    2007
  • 资助金额:
    $ 0.83万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
Estimation of Utility Function Based on Questionnaire Survey
基于问卷调查的效用函数估计
  • 批准号:
    13303007
  • 财政年份:
    2001
  • 资助金额:
    $ 0.83万
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)
Studies on Fuzzy Utility Function and Its policy Applications
模糊效用函数及其策略应用研究
  • 批准号:
    07453007
  • 财政年份:
    1995
  • 资助金额:
    $ 0.83万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了