学習システムを備えた生物規範に基づく2足歩行の実現

通过学习系统实现基于生物规范的双足运动

基本信息

  • 批准号:
    05J02829
  • 负责人:
  • 金额:
    $ 1.73万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
  • 财政年份:
    2005
  • 资助国家:
    日本
  • 起止时间:
    2005 至 2007
  • 项目状态:
    已结题

项目摘要

人間のダイナミクスは近似的に倒立振子モデルで説明されることが知られており,運動生理学やロボット工学の分野で様々な運動の説明や実現に広く使われている.我々は,このような汎用性の高いモデルに基づいて,ロボットの全身運動を効率的に学習・獲得させることを試みた.具体的には、倒立振子の状態・行動空間においてタスクを達成するための適切な重心制御則を学習し,獲得された重心の運動は全身の関節運動へと変換される.提案手法を,21自由度を有するヒューマノイドロボットにおけるインパクト動作の学習課題に適用した結果,数千回の試行回数により適切な全身運動が学習できることを数値実験により確認した.この成果に某づいて,国際学会で発表1件を行い,さらに論文誌1件への掲載が決定された.また,倒立振子モデル上での運動を全身関節の運動へと分配する際に問題となる不良設定性を,人の見本動データに基づいて解決する方法を提案し,シミュレーション実験によりその有効性を示した.この成果について,国内学会での発表1件を行った.さらに,より効率的な運動学習・環境適応性を実現するため,平均報酬の計量空間における強化学習法を提案した.提案手法は,強化学習の目的関数である平均報酬の計量空間上での方策勾配法であり,従来法で問題であったプラトー現象と呼ばれる学習の停滞を生じることなく,効率的な学習が実現される.また,極値付近では2次収束性も有している.この成果について,国内の研究会での発表1件を行った.今後は,2足歩行や全身運動のようなロボットの複雑な運動の学習に対する適用を目指す.
已知人类动力学在大约通过倒置模型中来解释,并在运动生理和机器人技术领域广泛使用,以解释和实现各种运动。基于这个多功能模型,我们试图有效地学习和获取机器人的整个身体运动。具体而言,我们学到了适当的重力控制规则,用于在倒置的状态和倒置的状态和行为空间中实现任务,重力中心的获得的运动被转换为整个身体的关节运动。我们将所提出的方法应用于具有21个自由度的人形机器人中影响运动的学习任务,并通过数值实验确认,可以通过数千个试验来学习适当的整个身体运动。该结果是在国际会议上的演讲,并决定在一篇论文中发表。此外,我们提出了一种解决缺陷设置问题的方法,这是一个基于人类样本数据的整个身体关节运动中的运动时的问题,并通过模拟实验证明了其有效性。日本一个日本社会进行了一个演讲。此外,为了实现更有效的运动学习和对环境的适应性,我们在平均奖励的计量空间中提出了一种加强学习方法。所提出的方法是平均奖励的计量空间中的一种测量梯度方法,这是强化学习的客观功能,并且可以在不停滞的学习停滞的情况下,可以实现有效的学习,这是常规方法的问题。它还围绕极端值具有二次收敛。日本研究小组进行了一个演讲。我们的目的是将其应用于复杂机器人的学习,例如两足动物和全身运动。

项目成果

期刊论文数量(7)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Learning CPG-based biped locomotion with a policy gradient method
逆運動学問題に置ける自然勾配法とヤコビアン擬似逆行列に基づく解法の等価性
基于自然梯度法和雅可比伪逆的逆运动学问题解的等价性
  • DOI:
  • 发表时间:
    2007
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Takamitsu Matsubara;Jun Morimoto;Jun Nakanishi;Masa-aki Sato;Kenji Doya;Takamitsu Matsubara;松原 崇充;Takamitsu Matsubara;松原 崇充
  • 通讯作者:
    松原 崇充
人間動作より抽出される低次元特徴空間におけるヒューマノイドの全身運動制御
从人体运动中提取的低维特征空间中的仿人全身运动控制
  • DOI:
  • 发表时间:
    2007
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Takamitsu Matsubara;Jun Morimoto;Jun Nakanishi;Masa-aki Sato;Kenji Doya;Takamitsu Matsubara;松原 崇充;Takamitsu Matsubara;松原 崇充;松原 崇充
  • 通讯作者:
    松原 崇充
Learning to acquire whole-body humanoid CoM movements to achieve dynamic tasks
平均報酬の多様体に基づく方策勾配法
基于平均奖励流形的策略梯度方法
  • DOI:
  • 发表时间:
    2007
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Takamitsu Matsubara;Jun Morimoto;Jun Nakanishi;Masa-aki Sato;Kenji Doya;Takamitsu Matsubara;松原 崇充
  • 通讯作者:
    松原 崇充
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

松原 崇充其他文献

A Gaussian Process-Based Active Learning Approach for Exoskeleton Robots
一种基于高斯过程的外骨骼机器人主动学习方法
  • DOI:
    10.11509/isciesci.62.10_423
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    濱屋 政志;松原 崇充;森本 淳
  • 通讯作者:
    森本 淳
見かけ上の誤差に頑健なシミュレーションから実環境への方策転移学習
从模拟到真实环境的策略迁移学习对明显错误具有鲁棒性
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    則永 悠;小澤 裕斗;松原 崇充
  • 通讯作者:
    松原 崇充
フロー合成したコポリマーに対する機械学習予測の量子化学計算による外挿性向上
使用量子化学计算改进流合成共聚物的机器学习预测的外推
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    高須賀 聖五;及川 駿登;吉村 誠慶;伊藤 翔;原嶋 庸介;高山 大鑑;浅野 重人;黒澤 哲;菅原 哲徳;畑中 美穂;宮尾 知幸;松原 崇充;大西 裕也;網代 広治;藤井 幹也
  • 通讯作者:
    藤井 幹也
多様な動作に適用可能な装具型エナジーハーベスタの試作
可应用于各种运动的矫形能量采集器原型
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    井川 優太郎;小林 泰介;松原 崇充
  • 通讯作者:
    松原 崇充
ラジカル重合反応におけるフロー合成プロセスのベイズ最適化
自由基聚合反应中流动合成过程的贝叶斯优化
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    伊藤 翔;高須賀 聖五;及川 駿登;原嶋 庸介;高山 大鑑;Aniruddha Nag;脇内 新樹;菅原 哲徳;畑中 美穂;宮尾 知幸;松原 崇充;大西 裕也;網代 広治;藤井 幹也
  • 通讯作者:
    藤井 幹也

松原 崇充的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('松原 崇充', 18)}}的其他基金

日常作業データによる模倣学習技術基盤の確立
利用日常工作数据建立模仿学习技术库
  • 批准号:
    24K03018
  • 财政年份:
    2024
  • 资助金额:
    $ 1.73万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
安全性と信頼性を備えたロボット強化学習の技術基盤の創出
为安全可靠的机器人强化学习奠定技术基础
  • 批准号:
    21H03522
  • 财政年份:
    2021
  • 资助金额:
    $ 1.73万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)

相似海外基金

生物規範脚ロボットの全身筋腱網を活用した俊敏ロコモーション制御
生物规范腿式机器人全身肌腱网络敏捷运动控制
  • 批准号:
    24K17234
  • 财政年份:
    2024
  • 资助金额:
    $ 1.73万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
動的ターゲットへの柔軟な追跡動作を可能にする生物規範型アルゴリズムの構築
构建能够灵活跟踪动态目标的生物规范算法
  • 批准号:
    24K14834
  • 财政年份:
    2024
  • 资助金额:
    $ 1.73万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
生物の関節や分岐の形態を規範とする最適設計法の開発と設計製造技術への応用
基于生物关节和分支形态的优化设计方法的发展及其在设计和制造技术中的应用
  • 批准号:
    24K00784
  • 财政年份:
    2024
  • 资助金额:
    $ 1.73万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Structural dynamics of voltage-gated ion channels and their implications for ion permeation and drug modulation
电压门控离子通道的结构动力学及其对离子渗透和药物调节的影响
  • 批准号:
    10583283
  • 财政年份:
    2023
  • 资助金额:
    $ 1.73万
  • 项目类别:
Illumination of TAAR2 Location, Function and Regulators
TAAR2 位置、功能和调节器的阐明
  • 批准号:
    10666759
  • 财政年份:
    2023
  • 资助金额:
    $ 1.73万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了