Nonlinear stochastic and dynamic decision processes by invariantAnd imbedding methods
采用不变和嵌入方法的非线性随机和动态决策过程
基本信息
- 批准号:21540132
- 负责人:
- 金额:$ 2.91万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research (C)
- 财政年份:2009
- 资助国家:日本
- 起止时间:2009 至 2012
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
We consider undiscounted semi-Markov decision process with a target set and our main concern is a problem minimizing threshold probability. We formulate the problem as an infinite horizon case with a recurrent class. We show that an optimal value function is a unique solution to an optimality equation and there exists a stationary optimal policy. Also several value iteration methods and a policy improvement method are given in our model. Furthermore, we investigate a relationship between threshold probabilities and expectations for total rewards.
考虑具有目标集的未折现半马尔可夫决策过程,主要关注阈值概率最小化问题。我们将问题表述为具有循环类的无限视界情况。我们证明了最优值函数是最优性方程的唯一解,并且存在平稳最优策略。同时给出了几种数值迭代方法和一种策略改进方法。此外,我们研究了总奖励的阈值概率和期望之间的关系。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Threshold Probability and Expectation Criteria for Additive Reward System
加性奖励系统的阈值概率和期望标准
- DOI:
- 发表时间:2011
- 期刊:
- 影响因子:0
- 作者:M. Sakaguchi;Y.Ohtsubo
- 通讯作者:Y.Ohtsubo
Weighted Quasi-Arithmetic Means and Domain Translations
加权准算术平均值和域翻译
- DOI:
- 发表时间:2012
- 期刊:
- 影响因子:0.7
- 作者:Toshio Sakata;Kazumitsu Maehara;Takeshi Sasaki;Toshio Sumi;Mitsuhiro Miyazaki;Yoshitaka Watanabe;and Makoto Tagami;瀬野裕美;林正美・税所康正;桑野一成;K. Yagasaki;Yoshida Yuji
- 通讯作者:Yoshida Yuji
負のマルコフ決定過程における二つの閾値確率最適化の方法,数理解析研究所講究録
负马尔可夫决策过程的两种阈值概率优化方法,数学研究所 Kokyuroku
- DOI:
- 发表时间:2011
- 期刊:
- 影响因子:0
- 作者:岩本誠一;木村 寛;矢ヶ崎一幸;瀬野裕美;渡部善隆;阪口昌彦,大坪義夫
- 通讯作者:阪口昌彦,大坪義夫
Autocountinuity from below of set functions and convergence in measure
集合函数自下而上的自计数性和测度收敛性
- DOI:10.1007/978-3-642-22833-9_9
- 发表时间:2011
- 期刊:
- 影响因子:0
- 作者:Jun Li;Masami Yasuda;Ling Zhou
- 通讯作者:Ling Zhou
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
OHTSUBO Yoshio其他文献
OHTSUBO Yoshio的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('OHTSUBO Yoshio', 18)}}的其他基金
Nonlinear dynamic optimization theory on stochastic model and its application to mathematical finance
随机模型的非线性动态优化理论及其在数理金融中的应用
- 批准号:
17540121 - 财政年份:2005
- 资助金额:
$ 2.91万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Studios on theory of optimization with utility in stochastic model
随机模型效用优化理论工作室
- 批准号:
14540125 - 财政年份:2002
- 资助金额:
$ 2.91万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
相似海外基金
計画数学における適応と制御についての研究
规划数学中的自适应与控制研究
- 批准号:
63540152 - 财政年份:1988
- 资助金额:
$ 2.91万 - 项目类别:
Grant-in-Aid for General Scientific Research (C)
不確実情報のもとでの計画数学の研究
不确定信息下的规划数学研究
- 批准号:
59540101 - 财政年份:1984
- 资助金额:
$ 2.91万 - 项目类别:
Grant-in-Aid for General Scientific Research (C)
適応制御の計画数学的研究
自适应控制规划数学研究
- 批准号:
58540107 - 财政年份:1983
- 资助金额:
$ 2.91万 - 项目类别:
Grant-in-Aid for General Scientific Research (C)
行動決定の計画数学的研究
行为决策的计划数学研究
- 批准号:
57540109 - 财政年份:1982
- 资助金额:
$ 2.91万 - 项目类别:
Grant-in-Aid for General Scientific Research (C)
計画数学とポテンシャル論との関連について
关于规划数学与势论的关系
- 批准号:
X00095----264038 - 财政年份:1977
- 资助金额:
$ 2.91万 - 项目类别:
Grant-in-Aid for General Scientific Research (D)
計画数学とポテンシャル論との関連について
关于规划数学与势论的关系
- 批准号:
X00095----164035 - 财政年份:1976
- 资助金额:
$ 2.91万 - 项目类别:
Grant-in-Aid for General Scientific Research (D)
計画数学とその応用
规划数学及其应用
- 批准号:
X00095----064130 - 财政年份:1975
- 资助金额:
$ 2.91万 - 项目类别:
Grant-in-Aid for General Scientific Research (D)
計画数学とポテンシャル論
规划数学和势能理论
- 批准号:
X46210------2016 - 财政年份:1971
- 资助金额:
$ 2.91万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)