Performance Analysis of a Reinforcement Learning Agent Using Multivariate Analysis Method Based on Dimension Reduction
基于降维的多元分析方法的强化学习智能体性能分析
基本信息
- 批准号:19500172
- 负责人:
- 金额:$ 2.83万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research (C)
- 财政年份:2007
- 资助国家:日本
- 起止时间:2007 至 2008
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
高次元の連続状態空間を直接扱うことのできるモデル追加型の強化学習アルゴリズムを開発した。このアルゴリズムの最大の特徴は、関数近似器のパラメータをうまく設定することで、モデル数を小さく抑えつつも良好な学習性能を実現できる点にある。このため、まず、パラメータの挙動解析を行い、最良のパラメータを見出した。つぎに、10次元の連続状態空間をもつ移動ロボットの移動障害物回避問題に適用し、有効性を確認した。
High dimensional continuous state space is directly connected to the system. The largest characteristic of this class is that the number of approximators is set to a small number, and good learning performance is achieved. This is the best way to solve the problem. The 10-dimensional state space is suitable for mobile obstacle avoidance.
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
高次元連続状態空間における強化学習-局所重み付き回帰手法を用いた価値関数近似-
高维连续状态空间中的强化学习 - 使用局部加权回归方法逼近价值函数 -
- DOI:
- 发表时间:2009
- 期刊:
- 影响因子:0
- 作者:一井宏次;釜谷博行;工藤憲
- 通讯作者:工藤憲
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
KAMAYA Hiroyuki其他文献
KAMAYA Hiroyuki的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
相似海外基金
スパース性及びサンプリング点の両視点に基づく効率的な高次元関数近似手法の探究
基于稀疏性和采样点视角的高效高维函数逼近方法探索
- 批准号:
23KJ0687 - 财政年份:2023
- 资助金额:
$ 2.83万 - 项目类别:
Grant-in-Aid for JSPS Fellows
組合せ構造に基づく関数近似とその応用
基于组合结构的函数逼近及其应用
- 批准号:
04J11480 - 财政年份:2004
- 资助金额:
$ 2.83万 - 项目类别:
Grant-in-Aid for JSPS Fellows
関数近似の新しい手法の開発
函数逼近新方法的开发
- 批准号:
14740073 - 财政年份:2002
- 资助金额:
$ 2.83万 - 项目类别:
Grant-in-Aid for Young Scientists (B)
ステップ関数近似による非線形境界値問題の解の効率的な数値的存在自動検証法の開発
开发一种使用阶跃函数近似解决非线性边值问题的高效数值自动验证方法
- 批准号:
11780240 - 财政年份:1999
- 资助金额:
$ 2.83万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
関数近似の手法に基づくニューラルネットワークの構成と学習に関する研究
基于函数逼近方法的神经网络配置与学习研究
- 批准号:
06780324 - 财政年份:1994
- 资助金额:
$ 2.83万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
SINC関数近似に基づく数値計算アルゴリズムの研究
基于SINC函数逼近的数值计算算法研究
- 批准号:
05650063 - 财政年份:1993
- 资助金额:
$ 2.83万 - 项目类别:
Grant-in-Aid for General Scientific Research (C)
双3次Bスプライン関数近似法による顎変形症の顔面形態変化の解析
双三次B样条函数逼近法分析颌骨畸形的面部形态变化
- 批准号:
04771821 - 财政年份:1992
- 资助金额:
$ 2.83万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
関数近似論における飽和理論の研究
函数逼近理论中饱和理论的研究
- 批准号:
04640116 - 财政年份:1992
- 资助金额:
$ 2.83万 - 项目类别:
Grant-in-Aid for General Scientific Research (C)
関数近似とフーリェ解析
函数逼近和傅里叶分析
- 批准号:
X00095----364040 - 财政年份:1978
- 资助金额:
$ 2.83万 - 项目类别:
Grant-in-Aid for General Scientific Research (D)














{{item.name}}会员




