連続時間ベクトル値マルコフ決定過程の凸最適解の研究

连续时间向量值马尔可夫决策过程的凸最优解研究

基本信息

  • 批准号:
    06640324
  • 负责人:
  • 金额:
    $ 1.34万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for General Scientific Research (C)
  • 财政年份:
    1994
  • 资助国家:
    日本
  • 起止时间:
    1994 至 无数据
  • 项目状态:
    已结题

项目摘要

以下の2つの研究集会にて講演を行い成果の発表を行った。[I]平成6年11月10日,京都大学数理解析研究所における研究集会にて題目:「(U,V,W)基準をもつベクトル値マルコフ決定過程について」 として数値計算例を含めて講演した。 理論的側面の一部の結果は,同研究所の講究録に収録され印刷中である。次の[II]の研究の基礎となる部分であり,割引率を伴う単一のマルコフ連鎖を中心にして,推移確率行列に対する固有多項式の正定値性と余因数行列との関係を明らかにした。[II]平成6年12月7日-12月9日 創価大学理工学部における研究集会にて題目:「多重連鎖をなすベクトル値マルコフ決定過程について」 として講演した。 結果は研究集会誌 「不確実性の下での最適化理論とその関連分野」P.8-17 に収録され概要を印刷発表した。ここに,[II]の講演内容の要旨を報告する。内容:ベクトル値の有限マルコフ決定過程において,マルコフ推移確率行列の中に潜む部分連鎖の数に応じた最適性の判定法に関する理論を構築した。それは Lemma2.1-2.4 および定理4.1-4.3から構成されている。平均型基準値,相対値および準相対値の系列をもち,優劣の判定がベクトル値による半順序で決定される最適化方程式と大域的最適解の発見法が与えられた。これによって最適政策の決定法を導いた。[I]および[II]の数値計算例はページ数の関係で未収録である。その分は平成7年度の宮崎大学教育学部の研究紀要等で発表する予定である。理論的側面を中心にした部分は,外国雑誌等にこれから投稿する予定である。
The following 2 research meetings were held to present the results. [I]On November 10, 2006, Kyoto University Institute of Mathematical Analysis held a seminar entitled "(U,V,W) Benchmarks and Determination Process." Part of the results of the theory are in accordance with the records of the Institute. The basic part of the study of [II] is that the relationship between the positive definite property of the inherent polynomial and the residual factor of the transition rate is clear. [II]December 7-December 9, 2006, Sokyo University Faculty of Science and Technology Research Conference Topic: "Multiple linkage analysis" Lecture Results A summary of the results was published in the journal "Optimization theory under uncertainty and correlation analysis" P.8-17. The main points of [II] are reported. Content: Construction of theory on the determination of the optimal number of potential links in the process of determining the finite number of links Lemma 2.1 -2.4 Theorem 4.1-4.3 Average type reference value, phase correlation value and quasi-phase correlation value series are determined by semi-sequential optimization equation and optimal solution of large domain. This paper introduces the method of determining the optimal policy. [I]The number of [II] calculation examples are not recorded. A summary of the research conducted by the Faculty of Education of Miyazaki University in 2007 The central part of the theory is the foreign journal, etc.

项目成果

期刊论文数量(4)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
伊喜 哲一郎: "(U,V,W)基準を持つベクトル値マルコフ決定過程について" 京都大学数理解析研究所講究録. (1995)
Tetsuichiro Iki:“关于具有 (U,V,W) 标准的向量值马尔可夫决策过程”Kokyuroku,京都大学数学科学研究所 (1995)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
伊喜 哲一郎: "多重連鎖をなすベクトル値マルコフ決定過程について" 平成6年度科学研究費報告集 不確実性の下での最適化理論とその関連分野. 8-17 (1995)
Tetsuichiro Iki:“论形成多链的向量值马尔可夫决策过程”1994 年科学研究资助报告,不确定性及相关领域的优化理论 8-17 (1995)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

伊喜 哲一郎其他文献

伊喜 哲一郎的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('伊喜 哲一郎', 18)}}的其他基金

平均型ベクトル基準値を持つ多目的マルコフ決定過程の凸最適解の研究
平均向量参考值多目标马尔可夫决策过程凸最优解研究
  • 批准号:
    03640224
  • 财政年份:
    1991
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (C)
多目的マルコフ決定過程論の教育工学への応用
多目标马尔可夫决策过程理论在教育技术中的应用
  • 批准号:
    57580191
  • 财政年份:
    1982
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (C)

相似海外基金

有限マルコフ決定過程における平均性能最適化の理論深化と情報理論における応用
深化有限马尔可夫决策过程平均性能优化理论及其在信息论中的应用
  • 批准号:
    20K11674
  • 财政年份:
    2020
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
部分観測可能マルコフ決定過程を用いた不確実な観測下での繰り返しゲーム理論の再構築
使用部分可观测马尔可夫决策过程重建不确定观测下的迭代博弈论
  • 批准号:
    13J04426
  • 财政年份:
    2013
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
マルコフ決定過程における分散および期待効用に関する最適化の研究
马尔可夫决策过程中方差与期望效用的优化研究
  • 批准号:
    08640284
  • 财政年份:
    1996
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
費用の分散を考慮したマルコフ決定過程とその応用に関する研究
考虑成本分散的马尔可夫决策过程研究及其应用
  • 批准号:
    08680461
  • 财政年份:
    1996
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
マルコフ決定過程の分散学習制御に関する研究
马尔可夫决策过程的分布式学习控制研究
  • 批准号:
    07750466
  • 财政年份:
    1995
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
制約付マルコフ決定過程への遺伝アルゴリズムの適用に関する研究
遗传算法在约束马尔可夫决策过程中的应用研究
  • 批准号:
    07680463
  • 财政年份:
    1995
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (C)
一般マルコフ決定過程と適応制御への応用
一般马尔可夫决策过程及其在自适应控制中的应用
  • 批准号:
    05640247
  • 财政年份:
    1993
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (C)
平均型ベクトル基準値を持つ多目的マルコフ決定過程の凸最適解の研究
平均向量参考值多目标马尔可夫决策过程凸最优解研究
  • 批准号:
    03640224
  • 财政年份:
    1991
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (C)
多目的マルコフ決定過程論の教育工学への応用
多目标马尔可夫决策过程理论在教育技术中的应用
  • 批准号:
    57580191
  • 财政年份:
    1982
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (C)
状態が直接観測できないマルコフ決定過程における最適方策の決定法
一种在无法直接观察状态的马尔可夫决策过程中确定最优策略的方法
  • 批准号:
    X00210----175216
  • 财政年份:
    1976
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了