確率制御問題のアルゴリズムと計算量に関する研究

随机控制问题的算法和计算复杂度研究

基本信息

  • 批准号:
    08740157
  • 负责人:
  • 金额:
    $ 0.64万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
  • 财政年份:
    1996
  • 资助国家:
    日本
  • 起止时间:
    1996 至 无数据
  • 项目状态:
    已结题

项目摘要

確率制御問題のうち、確率空間、状態空間等が複数個の確率空間、状態空間等の直積で定義される確率過程に対するマルコフ決定過程を取り上げた。定常、離散時間、割引型、無限期間、一般の状態空間、政策をマルコフ政策に制限した場合についての問題に対する最適値関数の計算量についての研究を行った。マルコフ決定過程の一般理論より、ある仮定の下では、最適値関数はベルマン方程式を満たし、又、逐次近似法により構成されることはよく知られたことである。本研究では、推移確率、利得関数、割引率、精度の4項目の組をインスタンス、インスタンスのクラスを問題、現時刻の確率過程の状態、次の時刻の確率過程の状態、アクションの3項目の組を質問とする計算モデルを設定した。そして、逐次近似法と関連させ、精度を決めたときsupノルムでの評価で最適値関数との誤差がその精度以下となる区分的に定数となる関数が存在するとき、そのアルゴリズムは正しいと定義し、オラクルとそのアルゴリズムによって実行される演算数の和でアルゴリズムの計算量を定義した。そこで、いくつかの数学的仮定の下で1 推移確率と利得関数がリプシッツ条件を満たし、消失状態を持たない場合2 1の条件の他に、マルコフ決定過程でよく知られているmixing条件を満たす場合3 推移確率と利得関数がリプシッツ条件を満たし、2でのmixing条件を満たし、消失状態をもつ場合の3通りの場合について考察した。評価の対象となるのは、それぞれ、各場合の条件を満たす設定の下で、その問題に対する正しいすべてのアルゴリズムに対して質問の最小値のオーダー評価(上界と下界)の考察を行った。
The accuracy control problem is defined as the direct product of a plurality of accuracy spaces, state spaces, etc., and the accuracy process is the decision process. Steady time, discrete time, cut-off type, infinite period, general state space, policy, policy, restriction, limit, occasion, problem, optimal value, calculation amount, research, and execution. The general theory of the malformation decision process, ある仮定の下では, and the optimum number of values ​​はベルマンsquare The program を満たし, and the successive approximation method により constitute the されることはよく知られたことである. In this study, the four items of this study are: transfer accuracy, profit margin, cutting rate, and accuracy. The status of the accuracy process at the time, the status of the accuracy process at the time, and the setting of the 3 project group question and calculation.そして、Successive approximation method and correlation させ、Precision をdetermination めたときsupノルムでのreview価でThe optimal value is the number of the error and the accuracy is less than the accuracy of the となるdifferentiation of the fixed number and the number of the となるkan number.するとき、そのアルゴリズムは正しいとDefinitionし、オラクルとそのアルゴリズムによって実行されるcalculus numberの和でアルゴリズムのcalculation quantityをDefinitionした.そこで、いくつかのMathematical 仮determinationの下で1 Transition accuracy and profit pass number がリプシッツ condition を満たし、Disappearing state をhold たない occasion 2 1のconditionsのに、マルコフdetermination processでよくknowられているmixingconditionsを満たす occasion 3 The moving accuracy rate and profit pass number are がリプシッツ condition を満たし, 2でのmixing conditions を満たし, disappearing state をもつ occasion の3 pass りの occasion について inspection した. Comments on the conditions of each occasion, such as the conditions for each occasion, and the problems of the problem.いすべてのアルゴリズムに対してquestionのMINIMUM値のオーダー Commentary価(上界と下界)のinvestigationを行った.

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Teruo Tanaka: "A matrix representation of fields and filtrations and its application to stochastic control problems" Journal of Information & Optimization Sciences. (1997)
Teruo Tanaka:“场和过滤的矩阵表示及其在随机控制问题中的应用”信息杂志
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

田中 輝雄其他文献

ソフトウェア自動チューニングのための疎行列ライブラリ用標本点追加型性能パラメタ推定法
软件自动调优稀疏矩阵库附加采样点性能参数估计方法
Japanese Auto-tuning Research: Auto-tuning Languages and FFT
日本自整定研究:自整定语言和FFT
  • DOI:
    10.1109/jproc.2018.2870284
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    20.6
  • 作者:
    望月 大義 ;藤井 昭宏;田中 輝雄;Watanabe Kazuho;Takahiro Katagiri and Daisuke Takahashi
  • 通讯作者:
    Takahiro Katagiri and Daisuke Takahashi
AVX2を用いた倍精度BCRS形式疎行列と倍々精度ベクトル積の高速化
使用AVX2对双精度BCRS格式稀疏矩阵和双精度向量积进行加速
Auto-tuning for The Era of Relatively High Bandwidth Memory Architectures: A Discussion Based on an FDM Application
高带宽内存架构时代的自动调优:基于 FDM 应用的讨论
  • DOI:
    10.1109/ipdpsw.2018.00167
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    望月 大義 ;藤井 昭宏;田中 輝雄;Watanabe Kazuho;Takahiro Katagiri and Daisuke Takahashi;Takahiro Katagiri
  • 通讯作者:
    Takahiro Katagiri
複数ばねによる質点の一次元運動シミュレーションに対するMultigrid Reduction in Timeの有効性の評価
使用多个弹簧进行质点一维运动模拟的多重网格时间缩减的有效性评估
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    藤戸 宙希,金子 重郎,藤井昭宏;田中 輝雄;鷲尾 巧;岩下 武史
  • 通讯作者:
    岩下 武史

田中 輝雄的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('田中 輝雄', 18)}}的其他基金

Development of performance parameter optimization tools for automatic tuning
自动调优性能参数优化工具开发
  • 批准号:
    23K11126
  • 财政年份:
    2023
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
大規模並列計算機用高精度演算環境の構築と演算精度自動チューニングの研究
大规模并行计算机高精度计算环境构建及计算精度自动调优研究
  • 批准号:
    18K11340
  • 财政年份:
    2018
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
確率制御問題の計算量とアルゴリズムに関する理論研究と数理ファイナンスへの応用
随机控制问题的计算复杂性和算法的理论研究及其在数学金融中的应用
  • 批准号:
    09740160
  • 财政年份:
    1997
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
多次元パラメータをもつ確率過程に対する制御理論
多维参数随机过程的控制理论
  • 批准号:
    03740117
  • 财政年份:
    1991
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)

相似海外基金

Reinforcement learning analysis of the impact of flood experience to the decision process of evacuation
强化学习分析洪水经历对疏散决策过程的影响
  • 批准号:
    23H01512
  • 财政年份:
    2023
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
EAGER: Rational Choice in the Real World: Unpacking Neighborhood Influences on the Decision Process for Youth Violence
EAGER:现实世界中的理性选择:揭示社区对青少年暴力决策过程的影响
  • 批准号:
    2308576
  • 财政年份:
    2023
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Standard Grant
有限マルコフ決定過程における平均性能最適化の理論深化と情報理論における応用
深化有限马尔可夫决策过程平均性能优化理论及其在信息论中的应用
  • 批准号:
    20K11674
  • 财政年份:
    2020
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Longitudinal Investigation of the Decision Process in Adoption of Course-based Undergraduate Research
本科生课程研究决策过程的纵向调查
  • 批准号:
    1912520
  • 财政年份:
    2019
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Standard Grant
部分観測可能マルコフ決定過程を用いた不確実な観測下での繰り返しゲーム理論の再構築
使用部分可观测马尔可夫决策过程重建不确定观测下的迭代博弈论
  • 批准号:
    13J04426
  • 财政年份:
    2013
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
A Neuroeconomic Theory of the Decision Process
决策过程的神经经济学理论
  • 批准号:
    0924896
  • 财政年份:
    2009
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Standard Grant
The elucidation of the decision process of the foreign policy for Japan of the Northeast China local gevernment under Washington treaty system and the analysis of the view of civilization confrontation
华盛顿条约体系下东北地方政府对日外交政策决策过程阐释及文明对抗观分析
  • 批准号:
    13610425
  • 财政年份:
    2001
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
費用の分散を考慮したマルコフ決定過程とその応用に関する研究
考虑成本分散的马尔可夫决策过程研究及其应用
  • 批准号:
    08680461
  • 财政年份:
    1996
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
マルコフ決定過程における分散および期待効用に関する最適化の研究
马尔可夫决策过程中方差与期望效用的优化研究
  • 批准号:
    08640284
  • 财政年份:
    1996
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
マルコフ決定過程の分散学習制御に関する研究
马尔可夫决策过程的分布式学习控制研究
  • 批准号:
    07750466
  • 财政年份:
    1995
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了