同型性に基づく抽象化プランニングのロボットの行動学習への応用
基于同构的抽象规划在机器人行为学习中的应用
基本信息
- 批准号:07750460
- 负责人:
- 金额:$ 0.64万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Encouragement of Young Scientists (A)
- 财政年份:1995
- 资助国家:日本
- 起止时间:1995 至 无数据
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
本年度は、前年度の成果として得られた、状態の同型性を抽象化に利用する“同型性に基づく抽象化問題解決"を拡張し、状態空間の階層的な同型性を利用して、効率的に抽象化問題解決する方法を研究すると共に、一般的な分野への応用として、同型な機能、構造を持つロボットの行動学習として、同型性に基づく抽象化強化学習法を考案し、以下の研究を行った。(1)状態空間の階層的な同型性の解析による、階層化抽象空間の生成同型性に基づく抽象化だけでは不十分な場合、抽象空間の階層的な同型性を利用すると、階層的な抽象空間を段階的に生成して、より小さな抽象空間を求め、解析の計算コストを削減することができることを示した。(2)効率的な抽象化プランニングと詳細化生成した階層的な抽象空間中に、初期状態と目標状態とを写像し、抽象空間における、初期状態と目標状態とを結ぶ状態遷移をプランニングにより求めて、抽象プランを効率よく探索できることを示した。(3)ロボットの行動学習システムの構築現有の計算機と通信しながら学習するロボットの行動学習システムを構築した。シミュレーション学習と実環境での実ロボットとのハイブリッド強化学習システムを作成し、両者の学習システムを共通化することにより、仮想個体、実ロボット間での学習結果の交換を可能とした。学習法として、経験強化型のClassifier Systemを元にして、高速化の拡張を行い、従来困難だった実ロボットでの実時間強化学習を実現した。(4)同型性に基づく強化学習法による、ロボットの多様な行動の獲得構築したロボットの行動学習システムを用いて、まずあるタスクで強化学習を行い、得た学習結果に対し、行為の同型性を利用した置換を組み合わせ的に施して同型な学習結果を生成し、学習結果のバリエーションの探索を行う。その結果、学習したタスクを達成する、同型な挙動や、学習タスクに似た、類似挙動など、従来の強化学習法では、得られない多様な行動を、効率的に獲得することができた。
In this year and the previous year, the results of this year and the previous year have been successful, the status of homomorphism has been abstracted, the abstraction of homomorphism has been used to solve the problem of abstraction of homomorphism, and the homomorphism of spatial distribution has been used to solve the problem of abstraction and efficiency. The methods of solving problems of abstraction have been used to study the problem of homomorphism, the same type of equipment, the In order to strengthen the examination plan of the chemical method, and the following research program, we should carry out the training program of behavioral science, the basis of homology and the abstract of the chemical examination plan. The main results are as follows: (1) the analysis of the homomorphism of the state space, the generation of the same type of the abstract space, the analysis of the homomorphism of the abstract space, the analysis of the homomorphism of the state space, the analysis of the homomorphism of the state space, the analysis and calculation of the abstract space, the abstract space segment, the abstract space segment, the abstract space segment and the abstract space segment. (2) the abstraction of the operating rate, the generation of the abstract space, the initial status header, the initial status target, the initial status target, the initial (3) there is an existing calculation machine, communication system, computer science and communication system. (3) there is an existing calculation machine. You may want to learn more about the environment, and the environment. Study the method to improve the performance of Classifier System, enhance the performance of high-speed equipment, and improve the performance of chemical analysis when it is necessary to improve the performance of the system. (4) the homotypic basic method strengthens the chemical experiment and the multi-test behavior of the chemical medicine. The results of the chemical experiments, the results of the The result of the study is that you will learn how to explore and explore. The result of the experiment, the result of the experiment, the result of the experiment,
项目成果
期刊论文数量(5)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Tomohiro Yamaguchi: "Propagating Leamed Behaviors from a Virtual Agent to a Physical Robot in Reinforcement Learning" Proc.of IEEE Int.Conf.on Evolutionary Computation(ICEC-96)at Nagoya,(accepted). (1996)
Tomohiro Yamaguchi:“在强化学习中将学习行为从虚拟代理传播到物理机器人”Proc.of IEEE Int.Conf.on Evolutionary Computation(ICEC-96),名古屋,(已接受)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
Tomohiro Yamaguchi: "Learning Cooperative Behaviors with Spontaneous Mimetism" Proc.of 6th Int.Fuzzy Systems Association World Congress(IFSA-95). Vol.1. 101-104 (1995)
Tomohiro Yamaguchi:“通过自发模仿学习合作行为”第六届国际模糊系统协会世界大会(IFSA-95)的会议记录。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
Tomohiro Yamaguchi: "Multi-agent Reinforcement Learning with Adaptive Mimetism" Proc.of 5th Int.Workshop on Artificial Life(ALife V)1996 at Nara,ATR,(poster accepted). (1996)
Tomohiro Yamaguchi:“自适应模仿的多智能体强化学习”Proc.of 5th Int.Workshop on Artificial Life(ALife V)1996,奈良,ATR,(已接受海报)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
田中康祐: "実ロボットとシミュレータ・エージェントとの協調による行動学習システム" 第13回ロボット学会学術講演会. No.1. 457-458 (1995)
Kosuke Tanaka:“基于真实机器人和模拟器代理之间合作的动作学习系统”日本机器人学会第 13 届年会第 1. 457-458 号(1995 年)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
増渕元臣: "ロボットにおけるドリブル動作の実環境下での強化学習" 第13回ロボット学会学術講演会. No.1. 459-460 (1996)
Motoomi Masubuchi:“真实环境中机器人运球的强化学习”,日本机器人学会第 13 届年会,第 1. 459-460 号(1996 年)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
山口 智浩其他文献
多次元空間問題における商品属性の関係理解と商品選定の支援
理解产品属性之间的关系并支持多维空间问题中的产品选择
- DOI:
- 发表时间:
2014 - 期刊:
- 影响因子:0
- 作者:
沢田石 祐弥;原田 智広;佐藤 寛之;服部 聖彦;高玉 圭樹;山口 智浩 - 通讯作者:
山口 智浩
Evaluation for Acquiring Method for Agents' Actions using Pheromone Communication in Multi-Agent System
多Agent系统中信息素通信的Agent行为获取方法评价
- DOI:
- 发表时间:
2013 - 期刊:
- 影响因子:0
- 作者:
沢田石 祐弥;原田 智広;佐藤 寛之;服部 聖彦;高玉 圭樹;山口 智浩;Hisayuki Sasaoka;Hisayuki Sasaoka - 通讯作者:
Hisayuki Sasaoka
異文化体験ゲームにおける集団適応エージェントモデルとインタラクション設計
跨文化体验游戏中的集体自适应代理模型与交互设计
- DOI:
- 发表时间:
2012 - 期刊:
- 影响因子:0
- 作者:
山口 智浩;山口 浩基;高玉 圭樹;Hisayuki Sasaoka;牛田 裕也,大谷 雅之,市川 嘉裕,佐藤 圭二,服部 聖彦,佐藤 寛之,高玉 圭樹 - 通讯作者:
牛田 裕也,大谷 雅之,市川 嘉裕,佐藤 圭二,服部 聖彦,佐藤 寛之,高玉 圭樹
別カテゴリ商品提示による好みの明確化を促す推薦システムの設計と評価
设计和评估推荐系统,通过展示不同类别的产品来促进偏好的明确化
- DOI:
- 发表时间:
2011 - 期刊:
- 影响因子:0
- 作者:
佐藤 史盟;大谷 雅之;服部 聖彦;佐藤寛之;高玉 圭樹;山口 智浩 - 通讯作者:
山口 智浩
山口 智浩的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('山口 智浩', 18)}}的其他基金
ロボットにおける心の機能の実現:メンタルシミュレーションを併用したロボット学習の高速化
机器人心理功能的实现:利用心理模拟加速机器人学习
- 批准号:
10780232 - 财政年份:1998
- 资助金额:
$ 0.64万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
同型性に基づく抽象化問題解決
基于同构的抽象问题求解
- 批准号:
06750420 - 财政年份:1994
- 资助金额:
$ 0.64万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
相似海外基金
肝臓内酸素動態を含む透析低血圧発症予知モデルの構築:統計・機械学習分析による解析
构建预测透析低血压发作(包括肝内氧动态)的模型:使用统计和机器学习分析进行分析
- 批准号:
24K15796 - 财政年份:2024
- 资助金额:
$ 0.64万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
臨床情報による高精度分娩進行予測モデルの開発: 機械学習の活用
利用临床信息开发高精度的分娩进展预测模型:利用机器学习
- 批准号:
24K13948 - 财政年份:2024
- 资助金额:
$ 0.64万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
新興感染症のシステマティック・レビューを機械学習を用いて簡易に実施するための研究
利用机器学习轻松对新发传染病进行系统评价的研究
- 批准号:
24K13518 - 财政年份:2024
- 资助金额:
$ 0.64万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
独立成分分析を活用した信頼性の高い機械学習手法の構築
使用独立成分分析构建可靠的机器学习方法
- 批准号:
24K15093 - 财政年份:2024
- 资助金额:
$ 0.64万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
学習過程情報に基づき理由を説明可能な高速論理型機械学習器の開発の提案
开发可根据学习过程信息解释原因的高速逻辑机器学习装置的提案
- 批准号:
24K15095 - 财政年份:2024
- 资助金额:
$ 0.64万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
多次元イベント時間データ解析の推測理論と方法・機械学習の開発
多维事件时间数据分析的推理理论和方法/机器学习的发展
- 批准号:
24K14853 - 财政年份:2024
- 资助金额:
$ 0.64万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
速度ポテンシャルエネルギー整形法と機械学習を用いた宇宙機制御理論の開発
利用速度势能整形方法和机器学习发展航天器控制理论
- 批准号:
23K20946 - 财政年份:2024
- 资助金额:
$ 0.64万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
ユビキタス機械学習社会におけるプライバシ保護基盤
无处不在的机器学习社会中的隐私保护基础设施
- 批准号:
23K21695 - 财政年份:2024
- 资助金额:
$ 0.64万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
正則化機能強化による超ロバスト推定法の開拓と一般化:信号処理・機械学習への応用
通过加强正则化功能开发和推广超鲁棒估计方法:在信号处理和机器学习中的应用
- 批准号:
23K22762 - 财政年份:2024
- 资助金额:
$ 0.64万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
攻撃に耐性を持つ機械学習モデルによる設計工程ハードウェアトロイ検知
使用抗攻击的机器学习模型在设计过程中检测硬件木马
- 批准号:
23K24816 - 财政年份:2024
- 资助金额:
$ 0.64万 - 项目类别:
Grant-in-Aid for Scientific Research (B)