权益分类	功能权益	普通用户	{{item.name}}会员
{{category.name}}	{{benefitItem.name}}

学習システムを備えた生物規範に基づく2足歩行の実現

通过学习系统实现基于生物规范的双足运动

基本信息

批准号：
05J02829
负责人：
松原崇充
金额：
$ 1.73万
依托单位：
Nara Institute of Science and Technology
依托单位国家：
日本
项目类别：
Grant-in-Aid for JSPS Fellows
财政年份：
2005
资助国家：
日本
起止时间：
2005 至 2007
项目状态：
已结题

项目摘要

人間のダイナミクスは近似的に倒立振子モデルで説明されることが知られており,運動生理学やロボット工学の分野で様々な運動の説明や実現に広く使われている.我々は,このような汎用性の高いモデルに基づいて,ロボットの全身運動を効率的に学習・獲得させることを試みた.具体的には、倒立振子の状態・行動空間においてタスクを達成するための適切な重心制御則を学習し,獲得された重心の運動は全身の関節運動へと変換される.提案手法を,21自由度を有するヒューマノイドロボットにおけるインパクト動作の学習課題に適用した結果,数千回の試行回数により適切な全身運動が学習できることを数値実験により確認した.この成果に某づいて,国際学会で発表1件を行い,さらに論文誌1件への掲載が決定された.また,倒立振子モデル上での運動を全身関節の運動へと分配する際に問題となる不良設定性を,人の見本動データに基づいて解決する方法を提案し,シミュレーション実験によりその有効性を示した.この成果について,国内学会での発表1件を行った.さらに,より効率的な運動学習・環境適応性を実現するため,平均報酬の計量空間における強化学習法を提案した.提案手法は,強化学習の目的関数である平均報酬の計量空間上での方策勾配法であり,従来法で問題であったプラトー現象と呼ばれる学習の停滞を生じることなく,効率的な学習が実現される.また,極値付近では2次収束性も有している.この成果について,国内の研究会での発表1件を行った.今後は,2足歩行や全身運動のようなロボットの複雑な運動の学習に対する適用を目指す.

Human のダイナミクスは approximate に handstand oscillator モデルで illustrate されることが know られており, exercise physiology やロボット engineering の eset で others 々のな movement that や be presently に hiroo く make われている. I 々は, このような high domestic sex のいモデルに base づいて, ロボットの body movement を sharper rate に study, obtain させることを try みた. Specific には, inverted oscillator の state action space においてタスクを reached するための appropriate な focus study をし suppression, obtain された focus の movement は systemic の masato section movement へと variations in される. Proposal gimmick を, 21 degrees of freedom をするヒューマノイドロボットにおけるインパクト action の learning subject に applicable した as a result, thousands of returning the の trial number により appropriate な body movement が learning できることを the numerical be 験により confirm した. この results に a づいて, international society で発 table 1 line をい, さらに paper 1 piece への first white jasmines load が decided された. また, inverted oscillator モデル on での movement section を systemic masato のへと distribution する interstate に problem となる bad qualitative を, の see this move データに base づいて solve する method proposed をしシミュレーション be 験によりその have sharper sex を shown した. この results について, domestic society での発 table 1 Line をった. さらに, よりな the working rate, motor learning environment, pleasant to 応を be presently するため, average reward の measurement space における reinforcement learning method proposed をした. Proposal は, reinforcement learning purpose の masato number である average reward の measurement space での order hook match method であり, 従 to law でであったプラトとー phenomenon called ばれる learning の stagnation を raw じることなく, sharper rate な learning が be presently される. また, extremely interesting to pay nearly では twice 収 beam sex も have している. この results について, domestic の The research association でで issues one table を conducts った. In the future,, two-foot walking や full-body movement <s:1> ようなロボット <s:1> re-雑な movement <e:1> learning に is applicable to する and を finger す.

项目成果

期刊论文数量（7）

专著数量（0）

科研奖励数量（0）

会议论文数量（0）

专利数量（0）

Learning CPG-based biped locomotion with a policy gradient method

DOI：
10.1016/j.robot.2006.05.012
发表时间：
2005-12
期刊：
5th IEEE-RAS International Conference on Humanoid Robots, 2005.
影响因子：
0
作者：
Takamitsu Matsubara;Jun Morimoto;Jun Nakanishi;Masa-aki Sato;Kenji Doya
通讯作者：
Takamitsu Matsubara;Jun Morimoto;Jun Nakanishi;Masa-aki Sato;Kenji Doya

逆運動学問題に置ける自然勾配法とヤコビアン擬似逆行列に基づく解法の等価性

基于自然梯度法和雅可比伪逆的逆运动学问题解的等价性

DOI：
发表时间：
2007
期刊：
影响因子：
0
作者：
Takamitsu Matsubara;Jun Morimoto;Jun Nakanishi;Masa-aki Sato;Kenji Doya;Takamitsu Matsubara;松原崇充;Takamitsu Matsubara;松原崇充
通讯作者：
松原崇充

人間動作より抽出される低次元特徴空間におけるヒューマノイドの全身運動制御

从人体运动中提取的低维特征空间中的仿人全身运动控制

DOI：
发表时间：
2007
期刊：
影响因子：
0
作者：
Takamitsu Matsubara;Jun Morimoto;Jun Nakanishi;Masa-aki Sato;Kenji Doya;Takamitsu Matsubara;松原崇充;Takamitsu Matsubara;松原崇充;松原崇充
通讯作者：
松原崇充

平均報酬の多様体に基づく方策勾配法

基于平均奖励流形的策略梯度方法

DOI：
发表时间：
2007
期刊：
影响因子：
0
作者：
Takamitsu Matsubara;Jun Morimoto;Jun Nakanishi;Masa-aki Sato;Kenji Doya;Takamitsu Matsubara;松原崇充
通讯作者：
松原崇充

Learning to acquire whole-body humanoid CoM movements to achieve dynamic tasks

DOI：
10.1109/robot.2007.363871
发表时间：
2007-04
期刊：
Proceedings 2007 IEEE International Conference on Robotics and Automation
影响因子：
0
作者：
Takamitsu Matsubara;J. Morimoto;J. Nakanishi;S. Hyon;Joshua G. Hale;G. Cheng
通讯作者：
Takamitsu Matsubara;J. Morimoto;J. Nakanishi;S. Hyon;Joshua G. Hale;G. Cheng