ベクトル量子化による状態・行動地図の不可逆圧縮
使用矢量量化对状态/行为图进行不可逆压缩
基本信息
- 批准号:17760199
- 负责人:
- 金额:$ 2.24万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Young Scientists (B)
- 财政年份:2005
- 资助国家:日本
- 起止时间:2005 至 2006
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
本研究課題は,最適制御問題を動的計画法で解いた解「状態行動地図」のメモリ容量を不可逆圧縮の代表的な手法であるベクトル量子化で圧縮するというものである.本年度は,申請者らの既発表のアルゴリズムの応用と評価を中心に研究を行い,成果を国内外の学会において発表し,今後雑誌論文として発表できる様々なデータを得た.本年度は,開発したアルゴリズムを大規模な問題へ適用し,評価を行った.その一つとして,ロボットサッカーでのマルチエージェント系となるタスク(パス)に本手法を適用した.状態行動地図の要素数は6億程度となったが,これを3.0GHz CPU,3.0GBのRAMを搭載した計算機で10日間計算することで,パスや互いに衝突を回避するなどの協調行動が見られる状態行動地図を得ることができた.また,この状態行動地図を同計算機で1日で圧縮することに成功し,結果的に実装するロボットのメモリ量(16MB)を下回る,8.2MBのベクトル量子化地図を得ることができた.また,シミュレーションではあるが,圧縮による地図でもロボットが協調して効率よく作業できることを示すことで,提案手法が,複雑なタスク用の地図を破綻させないで小さく圧縮できることを示せた.さらに,非常に非線形な制御問題であるアクロボットの振りあがりタスク,上記のロボットサッカーのタスク,人工知能の標準問題の一つである水たまりタスクにおいて,本手法と競合する手法との比較を行った.評価指標として,圧縮率と圧縮による性能劣化を計測した.結果,本手法で得られるベクトル量子化地図は,タスクの種類にかかわらず,他手法よりも安定して低消費メモリで性能劣化の小さい行動決定手法を記憶できることが示せた。
This research topic is to solve the optimal control problem by a dynamic planning method. This year, the applicant's application and evaluation center conducted research, the results were presented to domestic and foreign societies, and future research papers were presented to the public. This year, the development of large-scale problems, evaluation and implementation. This method is applicable to the application of this method in the system of. The number of elements in the state of action is 600 million, and the number of elements in the state of action is 3.0 GHz CPU, 3.0 GB RAM, and the number of elements in the state of action is 10. The status of the mobile site is the same as the computer on the 1st day. The result is the installation of the mobile site (16MB). The next time, 8.2 MB of the mobile site is quantized. In addition to the above, the author also pointed out that there is no need to reduce the pressure on the ground, and the proposal method is to reduce the pressure on the ground. In addition, the problem of very non-linear control is very difficult to solve, and the problem of artificial intelligence is very difficult to solve. Evaluation metrics are used to measure the compression rate and performance degradation due to compression. As a result, this method has been used to determine the behavior of the quantized ground, the type of ground, and the stability of the method.
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Dynamic Programming for Creating Cooperative Behavior of Two Soccer Robots - Part 1 : Computation of State-Action Map
用于创建两个足球机器人合作行为的动态规划 - 第 1 部分:状态动作图的计算
- DOI:
- 发表时间:2007
- 期刊:
- 影响因子:0
- 作者:Ryuichi Ueda;Kohei Sakamoto;Kazutaka Takeshita;Tamio Arai
- 通讯作者:Tamio Arai
Real-Time Decision Making with State-Value Function under Uncertainty of State Estimation -Evaluation with Local Maxima and Discontinuity
状态估计不确定性下的状态值函数实时决策-局部极大值和不连续性评估
- DOI:
- 发表时间:2005
- 期刊:
- 影响因子:0
- 作者:Ryuichi Ueda;et al.
- 通讯作者:et al.
Creation and Compression of Global Control Policy for Swinging up Control of the Acrobot
用于Acrobot摆动控制的全局控制策略的创建和压缩
- DOI:
- 发表时间:2006
- 期刊:
- 影响因子:0
- 作者:Ryuichi Ueda;Tamio Arai;Kojiro Matsushita
- 通讯作者:Kojiro Matsushita
Vector Quantization for State-Action Map Compression - Comparison with Coarse Discretization Techniques and Efficiency Enhancement
用于状态-动作图压缩的矢量量化 - 与粗离散化技术的比较和效率增强
- DOI:
- 发表时间:2005
- 期刊:
- 影响因子:0
- 作者:Ryuichi Ueda;Tamio Arai;Kazutaka Takeshita
- 通讯作者:Kazutaka Takeshita
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
上田 隆一其他文献
胴体部姿勢を考慮した四足歩行ロボットの最短時間制御
考虑身体姿态的四足步行机器人最短时间控制
- DOI:
- 发表时间:
2007 - 期刊:
- 影响因子:0
- 作者:
長谷川悠史;大隈 久;梅田 和昇;上田 隆一;新井 民夫 - 通讯作者:
新井 民夫
タスク達成に有効な複数の独立ルールの統合によるロボットの動作計画
通过集成有效完成任务的多个独立规则来进行机器人运动规划
- DOI:
- 发表时间:
2005 - 期刊:
- 影响因子:0
- 作者:
山野辺 夏樹;新井 民夫;上田 隆一 - 通讯作者:
上田 隆一
上田 隆一的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('上田 隆一', 18)}}的其他基金
位置情報の不足や誤りに強い自律移動ロボット用次世代ナビゲーションソフトウェア群
用于自主移动机器人的下一代导航软件,可防止位置信息丢失或错误
- 批准号:
24K15127 - 财政年份:2024
- 资助金额:
$ 2.24万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
相似海外基金
An Application of Stochastic Dynamic Programing to Various Problems in Market Microstructure
随机动态规划在市场微观结构中各种问题中的应用
- 批准号:
21K13325 - 财政年份:2021
- 资助金额:
$ 2.24万 - 项目类别:
Grant-in-Aid for Early-Career Scientists