実世界応用を目指した汎用的なエージェント行動学習の研究
针对实际应用的通用智能体行为学习研究
基本信息
- 批准号:20J15622
- 负责人:
- 金额:$ 1.09万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for JSPS Fellows
- 财政年份:2020
- 资助国家:日本
- 起止时间:2020-04-24 至 2022-03-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
欠損やノイズに対するロバスト性獲得に対する取り組みとして,パーティクルフィルタに注目して研究を進めた.本年度に取り組んだ研究は,パーティクルフィルタにおける観測欠損に対するロバスト性を向上させるため,機械学習によって環境モデルを獲得する手法を提案した.環境依存の環境モデルを人手で調整する必要なく,観測欠損が生じる場合においても状態推定を継続することが可能になった.本手法が,欠損状態が生じうる現実問題に広く適用可能であることを確認するため,センサデータや画像情報を用いた物体追跡問題に取り組んだ.その結果,観測欠損における推定精度は向上し,不確実性を考慮可能な信念分布として十分に利用可能であることを確認した.また,本年度は汎用性に関する研究を進めた.昨年度に引き続き,敵の動きが分かった後自チームの行動ポリシーを決定するための手法について実装を進めた.行動ポリシーの決定には,行動間の相性を考慮して統計的に勝利が多いか否かを調査する必要がある.本研究で扱っている環境はノイズの多い環境であるため,統計的アプローチを導入するためには莫大な試行回数のシミュレーションを行う必要がある.この問題に対して,シミュレーションの分散実行システムを構築した.そしてこの分散実行システムを介して十分なシミュレーションを実行したうえでデータ分析を行うことで,エージェントの行動変化を統計的に確認した.統計的な根拠のもとで状況に応じた行動選択が可能になれば,汎用的な意思決定が実現可能となる.
The research on the relationship between the two groups was carried out. This year's group research is aimed at proposing ways to improve the quality of the environment by mechanical learning. Environment dependent environment, manual adjustment necessary, measurement of loss caused by the situation, state estimation, possible This method is used to solve the problem of insufficient damage. The problem of object tracking is selected according to the application possibility. The result is that the estimation accuracy of the measurement is upward, and the uncertainty is considered to be the distribution of the possible beliefs. This year's research is very useful. Last year, the enemy's actions were divided into three parts, and then the actions were divided into three parts. The decision of the action is based on the consideration of the correlation between the action and the victory of the investigation. This study is about the environment and the number of test cases. The problem is that the system of decentralized operation is constructed. In addition to the above, the Company has also established a system of statistical analysis to verify the effectiveness of its activities. The root cause of statistics is the situation, the choice of action is possible, and the rational decision of universal use is possible.
项目成果
期刊论文数量(9)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
パーティクルフィルタにおける状態欠損に対する機械学習手法の導入
粒子滤波器状态损失机器学习方法介绍
- DOI:
- 发表时间:2022
- 期刊:
- 影响因子:0
- 作者:Kawami;F.;Matsukawa;A.;& TATSUKI;S.;宇野辺尭子;福島 卓弥,中島 智晴,楠木 祥文,秋山 英久
- 通讯作者:福島 卓弥,中島 智晴,楠木 祥文,秋山 英久
eam Classification with Tactical Analysis Using Fuzzy Inference in RoboCup Soccer
在 RoboCup 足球比赛中使用模糊推理进行球队分类和战术分析
- DOI:
- 发表时间:2020
- 期刊:
- 影响因子:0
- 作者:Fukushima Takuya;Nakashima Tomoharu;Torra Vicenc
- 通讯作者:Torra Vicenc
Evaluation-function modeling with multi-layered perceptron for RoboCup soccer 2D simulation
- DOI:10.1007/s10015-020-00602-w
- 发表时间:2020-04
- 期刊:
- 影响因子:0.9
- 作者:Takuya Fukushima;T. Nakashima;Hidehisa Akiyama
- 通讯作者:Takuya Fukushima;T. Nakashima;Hidehisa Akiyama
Introduction of Machine Learning for Handling Missing States in Particle Filter
引入机器学习来处理粒子滤波器中的缺失状态
- DOI:
- 发表时间:2022
- 期刊:
- 影响因子:0
- 作者:Takuya Fukushima;Tomoharu Nakashima;Yoshifumi Kusunoki;Hidehisa Akiyama
- 通讯作者:Hidehisa Akiyama
A Study on the Effect of Team Names on the Team Strategy
团队名称对团队策略影响的研究
- DOI:
- 发表时间:2021
- 期刊:
- 影响因子:0
- 作者:Kyo Hatakeyama;Takuya Fukushima;Yoshifumi Kusunoki;Tomoharu Nakashima;Hidehisa Akiyama
- 通讯作者:Hidehisa Akiyama
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
福島 卓弥其他文献
福島 卓弥的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
相似海外基金
Multi-objective stochastic search based on network topology and its application to evolutionary robotics
基于网络拓扑的多目标随机搜索及其在进化机器人中的应用
- 批准号:
22500201 - 财政年份:2010
- 资助金额:
$ 1.09万 - 项目类别:
Grant-in-Aid for Scientific Research (C)