確率制御問題のアルゴリズムと計算量に関する研究

随机控制问题的算法和计算复杂度研究

基本信息

  • 批准号:
    08740157
  • 负责人:
  • 金额:
    $ 0.64万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
  • 财政年份:
    1996
  • 资助国家:
    日本
  • 起止时间:
    1996 至 无数据
  • 项目状态:
    已结题

项目摘要

確率制御問題のうち、確率空間、状態空間等が複数個の確率空間、状態空間等の直積で定義される確率過程に対するマルコフ決定過程を取り上げた。定常、離散時間、割引型、無限期間、一般の状態空間、政策をマルコフ政策に制限した場合についての問題に対する最適値関数の計算量についての研究を行った。マルコフ決定過程の一般理論より、ある仮定の下では、最適値関数はベルマン方程式を満たし、又、逐次近似法により構成されることはよく知られたことである。本研究では、推移確率、利得関数、割引率、精度の4項目の組をインスタンス、インスタンスのクラスを問題、現時刻の確率過程の状態、次の時刻の確率過程の状態、アクションの3項目の組を質問とする計算モデルを設定した。そして、逐次近似法と関連させ、精度を決めたときsupノルムでの評価で最適値関数との誤差がその精度以下となる区分的に定数となる関数が存在するとき、そのアルゴリズムは正しいと定義し、オラクルとそのアルゴリズムによって実行される演算数の和でアルゴリズムの計算量を定義した。そこで、いくつかの数学的仮定の下で1 推移確率と利得関数がリプシッツ条件を満たし、消失状態を持たない場合2 1の条件の他に、マルコフ決定過程でよく知られているmixing条件を満たす場合3 推移確率と利得関数がリプシッツ条件を満たし、2でのmixing条件を満たし、消失状態をもつ場合の3通りの場合について考察した。評価の対象となるのは、それぞれ、各場合の条件を満たす設定の下で、その問題に対する正しいすべてのアルゴリズムに対して質問の最小値のオーダー評価(上界と下界)の考察を行った。
The definition of the direct product of the probability control problem, the probability space, the state space, etc. Research on the calculation quantity of optimal relationship in steady state, discrete time, cut-off type, infinite period, general state space, policy, policy, restriction and situation The general theory of the decision process, the optimal value of the equation, and the successive approximation method This study sets the parameters for the group of four items, namely, the accuracy rate, the profit relation, the cutting rate, the accuracy rate, the status of the accuracy rate process at the present time, the status of the accuracy rate process at the next time, and the calculation of the group of three items. For example, successive approximation method, correlation, accuracy determination, optimal correlation number, error determination, differential determination, correlation number, existence, correction, definition, calculation, sum of calculation, etc. 1. The accuracy of the process and the gain of the process are determined by the condition of the process and the mixing condition. 2. The mixing condition of the process is determined by the condition of the process. 3. The accuracy of the process and the gain of the process are determined by the condition of the process. The evaluation of the minimum value of the problem is based on the condition that the problem is set.

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Teruo Tanaka: "A matrix representation of fields and filtrations and its application to stochastic control problems" Journal of Information & Optimization Sciences. (1997)
Teruo Tanaka:“场和过滤的矩阵表示及其在随机控制问题中的应用”信息杂志
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

田中 輝雄其他文献

ソフトウェア自動チューニングのための疎行列ライブラリ用標本点追加型性能パラメタ推定法
软件自动调优稀疏矩阵库附加采样点性能参数估计方法
Japanese Auto-tuning Research: Auto-tuning Languages and FFT
日本自整定研究:自整定语言和FFT
  • DOI:
    10.1109/jproc.2018.2870284
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    20.6
  • 作者:
    望月 大義 ;藤井 昭宏;田中 輝雄;Watanabe Kazuho;Takahiro Katagiri and Daisuke Takahashi
  • 通讯作者:
    Takahiro Katagiri and Daisuke Takahashi
AVX2を用いた倍精度BCRS形式疎行列と倍々精度ベクトル積の高速化
使用AVX2对双精度BCRS格式稀疏矩阵和双精度向量积进行加速
Auto-tuning for The Era of Relatively High Bandwidth Memory Architectures: A Discussion Based on an FDM Application
高带宽内存架构时代的自动调优:基于 FDM 应用的讨论
  • DOI:
    10.1109/ipdpsw.2018.00167
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    望月 大義 ;藤井 昭宏;田中 輝雄;Watanabe Kazuho;Takahiro Katagiri and Daisuke Takahashi;Takahiro Katagiri
  • 通讯作者:
    Takahiro Katagiri
複数ばねによる質点の一次元運動シミュレーションに対するMultigrid Reduction in Timeの有効性の評価
使用多个弹簧进行质点一维运动模拟的多重网格时间缩减的有效性评估
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    藤戸 宙希,金子 重郎,藤井昭宏;田中 輝雄;鷲尾 巧;岩下 武史
  • 通讯作者:
    岩下 武史

田中 輝雄的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('田中 輝雄', 18)}}的其他基金

Development of performance parameter optimization tools for automatic tuning
自动调优性能参数优化工具开发
  • 批准号:
    23K11126
  • 财政年份:
    2023
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
大規模並列計算機用高精度演算環境の構築と演算精度自動チューニングの研究
大规模并行计算机高精度计算环境构建及计算精度自动调优研究
  • 批准号:
    18K11340
  • 财政年份:
    2018
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
確率制御問題の計算量とアルゴリズムに関する理論研究と数理ファイナンスへの応用
随机控制问题的计算复杂性和算法的理论研究及其在数学金融中的应用
  • 批准号:
    09740160
  • 财政年份:
    1997
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
多次元パラメータをもつ確率過程に対する制御理論
多维参数随机过程的控制理论
  • 批准号:
    03740117
  • 财政年份:
    1991
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)

相似海外基金

有限マルコフ決定過程における平均性能最適化の理論深化と情報理論における応用
深化有限马尔可夫决策过程平均性能优化理论及其在信息论中的应用
  • 批准号:
    20K11674
  • 财政年份:
    2020
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
部分観測可能マルコフ決定過程を用いた不確実な観測下での繰り返しゲーム理論の再構築
使用部分可观测马尔可夫决策过程重建不确定观测下的迭代博弈论
  • 批准号:
    13J04426
  • 财政年份:
    2013
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
マルコフ決定過程における分散および期待効用に関する最適化の研究
马尔可夫决策过程中方差与期望效用的优化研究
  • 批准号:
    08640284
  • 财政年份:
    1996
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
費用の分散を考慮したマルコフ決定過程とその応用に関する研究
考虑成本分散的马尔可夫决策过程研究及其应用
  • 批准号:
    08680461
  • 财政年份:
    1996
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
マルコフ決定過程の分散学習制御に関する研究
马尔可夫决策过程的分布式学习控制研究
  • 批准号:
    07750466
  • 财政年份:
    1995
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
制約付マルコフ決定過程への遺伝アルゴリズムの適用に関する研究
遗传算法在约束马尔可夫决策过程中的应用研究
  • 批准号:
    07680463
  • 财政年份:
    1995
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (C)
連続時間ベクトル値マルコフ決定過程の凸最適解の研究
连续时间向量值马尔可夫决策过程的凸最优解研究
  • 批准号:
    06640324
  • 财政年份:
    1994
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (C)
一般マルコフ決定過程と適応制御への応用
一般马尔可夫决策过程及其在自适应控制中的应用
  • 批准号:
    05640247
  • 财政年份:
    1993
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (C)
平均型ベクトル基準値を持つ多目的マルコフ決定過程の凸最適解の研究
平均向量参考值多目标马尔可夫决策过程凸最优解研究
  • 批准号:
    03640224
  • 财政年份:
    1991
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (C)
多目的マルコフ決定過程論の教育工学への応用
多目标马尔可夫决策过程理论在教育技术中的应用
  • 批准号:
    57580191
  • 财政年份:
    1982
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了