強化学習による移動ロボットのための状態空間の自動構成法に関する研究
基于强化学习的移动机器人状态空间自动构建研究
基本信息
- 批准号:07243214
- 负责人:
- 金额:$ 1.41万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research on Priority Areas
- 财政年份:1995
- 资助国家:日本
- 起止时间:1995 至 无数据
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
強化学習を適用するには、状態空間を適切に選択する必要がある.本研究では,選択されたセンサー情報を自律的に分割する問題を,サッカーロボットがシューティング行動を強化学習するタンクを例にとり,経験による視覚情報の文節化を実施した.本年度の研究実績及び評価は以下の通りである.視覚情報から得られる情報として,ロボットに塔載されたTVカメラから得られるボール及びゴールの画像が得られ,二つの独立なモーターで起動される移動車を想定した.1.状態空間を構成する要素として,ボールの位置,大きさ,ゴールの位置,大きさ,向きを選択した.情報選択に関しては、統計的手法を用いて自動化を試みており,対象物体が背景から容易に抽出できる場合は,選択可能性が高いことを確認している.移動車は,左右独立のモータにそれぞれ,前進,停止,後退の3種の動きが実現でき,合計9つの移動がとれる行動空間を想定した.ボールをゴールにシュートできる行動と状態のペアを経験から求め,状態空間のサンプリング点として記録し,統計的手法を用いて,成功を多く含み失敗をなるべくふくまない凸の状態集合を求め,一つの状態として記録した.上で獲得された状態をゴール状態として,同様の操作を繰り返し、経験に基づく状態空間のクラスタリングを実現した.クラスタリングされた状態空間を用いて強化学習を実施し,状態数の軽減,それゆえ学習時間が激減できることをシミュレーションで示した.実機でデータをサンプルし学習を実施した結果,シュート行動が実現され,手法の有効性が確認できた.但し,データサンプルに偏りがあると,失敗することもあり,いかに良好なデータを与えるかが,今後の課題となった.
Reinforcement learning is necessary This study focuses on the problem of segmentation of visual information and the implementation of visual information segmentation. This year's research achievements and comments are as follows. Visual information can be obtained from the information and images of TV, TV Information selection is related to the use of statistical methods, automation, testing, image objects from the background, easy to extract, and the possibility of selection is high. The mobile car is independent of the left and right, and the three kinds of movement are forward, stop, and backward. The total of 9 kinds of movement is determined by the movement space. The method of statistical analysis is used to find out how many successes include failures, and how many states are recorded. On the other hand, the state of the base state space can be obtained by changing the state of the base state space to the state of the base state space. The state space is used to implement reinforcement learning, the number of states is reduced, and the learning time is reduced. The results of the implementation of the study, the implementation of the action, and the effectiveness of the method are confirmed. However, the problem is that there is no way to solve it.
项目成果
期刊论文数量(7)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
野田: "強化学習によるロボットの行動獲得のための状態空間の自律的構成" 第5回ロボットシンポジウム予稿集. 145-150 (1995)
野田:“使用强化学习获取机器人行为的状态空间的自主配置”第五届机器人研讨会论文集145-150(1995)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
M.Asada: "Non-physical intervention in robot learning based on lfe Programming by Demonstration method" Proc,of Machine Learning Conference Workshop on Learning from Examples vs.25-31 (1995)
M.Asada:“基于演示方法的生命编程的机器人学习中的非物理干预”Proc,of Machine Learning Conference Workshop on Learning from Examples vs.25-31 (1995)
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
浅田: "ロボットの行動獲得のための状態空間の自律的構成" 第9回人工知能 学会全国大会論文集. 157-160 (1995)
Asada:“机器人行为获取的状态空间的自主配置”第九届全国人工智能学会会议论文集157-160(1995)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
M.Asada: "Vision-based reinforcement Learming for purposive behavior acquisition" Proc.of IEEE Int.Conf.on Robotics and Automation. 146-153 (1995)
M.Asada:“用于有目的行为习得的基于视觉的强化学习”Proc.of IEEE Int.Conf.on Robotics and Automation。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
浅田 稔其他文献
Discussion Visualization on a Bulletin Board System
公告板系统上的讨论可视化
- DOI:
- 发表时间:
2007 - 期刊:
- 影响因子:0
- 作者:
渡辺 絢子;荻野 正樹;浅田 稔;Wataru Sunayama - 通讯作者:
Wataru Sunayama
Wakan kotengaku no ontorogii
和观古天乐的本体
- DOI:
- 发表时间:
2007 - 期刊:
- 影响因子:0
- 作者:
渡辺 絢子;荻野 正樹;浅田 稔;Wataru Sunayama;Mitsuru Aida - 通讯作者:
Mitsuru Aida
拮抗型空気圧人工筋を持つ3次元2足ロボットの試作と歩行の実現
3维对抗性气动人工肌肉双足机器人样机制作及行走实现
- DOI:
- 发表时间:
2005 - 期刊:
- 影响因子:0
- 作者:
石川 政行;田熊 隆史;細田 耕;浅田 稔 - 通讯作者:
浅田 稔
浅田 稔的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('浅田 稔', 18)}}的其他基金
養育者との相互作用発達研究のための乳幼児様発声ロボットの製作および検証
仿婴儿发声机器人的制造和验证,用于与护理人员互动的发育研究
- 批准号:
24650094 - 财政年份:2012
- 资助金额:
$ 1.41万 - 项目类别:
Grant-in-Aid for Challenging Exploratory Research
構成的手法による身体バブリングから社会性獲得にいたる発達過程の理解と構築
使用建构性方法理解和构建从身体冒泡到社会化习得的发展过程
- 批准号:
22220002 - 财政年份:2010
- 资助金额:
$ 1.41万 - 项目类别:
Grant-in-Aid for Scientific Research (S)
多様な構成的手法の融合に基づく言語創発過程の統合的理解
基于多种组合方法融合的语言生成过程的综合理解
- 批准号:
17630001 - 财政年份:2005
- 资助金额:
$ 1.41万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
自己と他者の同一性仮説に基づく他者の行動理解のための模倣技能の獲得
获得模仿技能,以基于自我和他人的身份假设来理解他人的行为
- 批准号:
13875051 - 财政年份:2001
- 资助金额:
$ 1.41万 - 项目类别:
Grant-in-Aid for Exploratory Research
オートポイエ-シス理論の応用によるロボットの自律性の創製に関する研究
应用自创生理论创造机器人自主性的研究
- 批准号:
08875055 - 财政年份:1996
- 资助金额:
$ 1.41万 - 项目类别:
Grant-in-Aid for Exploratory Research
強化学習による移動ロボットのための状態空間の自動構成法に関する研究
基于强化学习的移动机器人状态空间自动构建研究
- 批准号:
08233213 - 财政年份:1996
- 资助金额:
$ 1.41万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
感覚と行動のマッピングに基づく移動ロボットの行動獲得及び統合に関する研究
基于感知和行为映射的移动机器人行为获取与集成研究
- 批准号:
08235213 - 财政年份:1996
- 资助金额:
$ 1.41万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
感覚と行動のマッピングに基づく移動ロボットの行動獲得及び統合に関する研究
基于感知和行为映射的移动机器人行为获取与集成研究
- 批准号:
07245214 - 财政年份:1995
- 资助金额:
$ 1.41万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
強化学習を用いたサッカーのシューティングロボットの目的行動の獲得
使用强化学习获得足球射门机器人的所需行为
- 批准号:
06650301 - 财政年份:1994
- 资助金额:
$ 1.41万 - 项目类别:
Grant-in-Aid for General Scientific Research (C)
濃淡情報の定性的な性質と輪郭線情報を統合利用した3次元物体の形状及び姿勢の復元
综合利用阴影信息和轮廓信息的定性特性重建 3D 物体的形状和方向
- 批准号:
05650395 - 财政年份:1993
- 资助金额:
$ 1.41万 - 项目类别:
Grant-in-Aid for General Scientific Research (C)
相似海外基金
Ergodic theory and multifractal analysis for non-uniformly hyperbolic dynamical systems with a non-compact state space
非紧状态空间非均匀双曲动力系统的遍历理论和多重分形分析
- 批准号:
24K06777 - 财政年份:2024
- 资助金额:
$ 1.41万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
欠損データの処理過程を組み込んだ状態空間モデルに関する哲学的研究
结合缺失数据处理的状态空间模型的哲学研究
- 批准号:
24K03607 - 财政年份:2024
- 资助金额:
$ 1.41万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
状態空間モデリングに対する深層学習と代数的手法の連携
结合深度学习和代数方法进行状态空间建模
- 批准号:
24K16963 - 财政年份:2024
- 资助金额:
$ 1.41万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
計算論的思考育成のための状態空間モデルを用いたプログラミング上の見通しの検知
使用状态空间模型检测编程视角以培养计算思维
- 批准号:
23K24963 - 财政年份:2024
- 资助金额:
$ 1.41万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
Variational Inference for Intractable and Misspecified State Space Models
棘手且错误指定的状态空间模型的变分推理
- 批准号:
DE230100029 - 财政年份:2023
- 资助金额:
$ 1.41万 - 项目类别:
Discovery Early Career Researcher Award
線形ガウス状態空間モデルを使った諸予測と、高次元での実用化に向けた高速化
使用线性高斯状态空间模型进行各种预测并加速高维实际应用
- 批准号:
22KJ2458 - 财政年份:2023
- 资助金额:
$ 1.41万 - 项目类别:
Grant-in-Aid for JSPS Fellows
Development of Deep Machine Learning Method for Generalized State Space Models Using Prior Knowledge Constraints and Weak Learning
使用先验知识约束和弱学习的广义状态空间模型深度机器学习方法的开发
- 批准号:
23H00471 - 财政年份:2023
- 资助金额:
$ 1.41万 - 项目类别:
Grant-in-Aid for Scientific Research (A)
微小拡散過程で記述される感染症数理モデルの状態空間表現とその推定法の開発
微扩散过程描述的传染病数学模型的状态空间表示及其估计方法的发展
- 批准号:
23K16852 - 财政年份:2023
- 资助金额:
$ 1.41万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
Detailed CB equations in QBD processes with explosive state space and its applications to queueing models
具有爆炸状态空间的QBD过程中的详细CB方程及其在排队模型中的应用
- 批准号:
22K11923 - 财政年份:2022
- 资助金额:
$ 1.41万 - 项目类别:
Grant-in-Aid for Scientific Research (C)