Development of deep learning to reveal physical human-robot interaction and its application to safe robot control
深度学习的发展揭示了人机物理交互及其在安全机器人控制中的应用
基本信息
- 批准号:20H04265
- 负责人:
- 金额:$ 11.15万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research (B)
- 财政年份:2020
- 资助国家:日本
- 起止时间:2020-04-01 至 2024-03-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
本研究では,多自由度系のロボットとヒトとの物理的接触を安全にするための学習制御技術開発を目的としている.これに向けて2022年度では,i)人と間接的に物理的接触する課題における潜在空間の抽出,ii)環境との離散的な接触状況が切り替わる脚ロボットへの強化学習の適用,iii)Sim-to-Real技術の物理的接触を扱う実ロボットへの適用,の3項目を中心に研究を実施した.i)では,人とロープを介してインタラクションするロボットを用いた実機実験にて,人とロボットが協働でロープを動かす動作時の人の骨格データを潜在空間へと抽出する課題を実施した.周期的な時系列データであることに注目して,変分オートエンコーダに複素型リザーバコンピューティングと潜在ダイナミクスモデルを組み込んだ世界モデルを用いることで,異なる動作を容易に区別可能な潜在空間の獲得と予測精度の向上を実現した.ii)では,脚ロボットの歩行制御課題に対して,End-to-Endでダイナミクスを学習するよりも,接触状況に応じてダイナミクスを陽に分割して学習したほうが予測精度が高まることがわかった.この結果より,接触状況により変化するダイナミクスを明確に区別できる潜在空間の重要性を改めて確認した.iii)では,実世界での学習コストを軽減すべく,ドメイン乱択化・適応を統合した新しい強化学習理論を提案した.具体的には,ドメイン乱択化を多目的最適化問題として解釈することで,実環境を選好解とみなすことを理論的に保証した.この理論により,ロボットハンドによるバルブ操作スキルをシミュレーション上で学習した後に実ロボットでも即座に達成することに成功した.
This study aims at the development of learning control technology for multi-degree-of-freedom systems and physical contact security. In the year 2022, i) extraction of potential space in the subject of indirect human and physical contact, ii) application of reinforcement learning in discrete environmental and physical contact, iii) application of physical contact in Sim-to-Real technology, and iii) implementation of central research in three projects.i) The problem of human bone structure extraction is solved. Periodic time series is easy to distinguish between different actions, potential space acquisition, prediction accuracy, and upward realization.ii) Reverse motion control is easy to learn, End-to-End. Contact status: Contact status As a result, the importance of potential space has changed.iii) The importance of potential space has changed. iii) The importance of potential space has changed. Specifically, it is theoretically guaranteed that the multi-purpose optimization problem can be solved in a chaotic manner, and the solution can be selected in the real environment. The theory is that we can learn from each other.
项目成果
期刊论文数量(23)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
フェヒナーの法則に従う強化学習則の挙動解析
根据费希纳定律对强化学习规则进行行为分析
- DOI:
- 发表时间:2022
- 期刊:
- 影响因子:0
- 作者:Daichi Yamamoto;Ichiro Kawashima;Hakaru Tamukoh;Takashi Morie;and Yuichi Katori;彌田尚希,吉田昭太郎;広田 雅和;高橋 慶一郎,小林 泰介,松原 崇充
- 通讯作者:高橋 慶一郎,小林 泰介,松原 崇充
強化学習における局所リプシッツ連続に関する正則化
强化学习中局部 Lipschitz 连续性的正则化
- DOI:
- 发表时间:2021
- 期刊:
- 影响因子:0
- 作者:鍛冶 静雄;木田 智士;藤田 広志;小林 泰介
- 通讯作者:小林 泰介
拡大Tchebyshev関数を用いた多目的最適化としての潜在ダイナミクスモデルの学習
使用扩展 Tchebyshev 函数将潜在动力学模型学习为多目标优化
- DOI:
- 发表时间:2021
- 期刊:
- 影响因子:0
- 作者:M. Kondo;T. Niiyama;and S. Sunada;武田 敏季,小林 泰介,杉本 謙二
- 通讯作者:武田 敏季,小林 泰介,杉本 謙二
拡大Tchebyshev関数を用いた多目的最適化としての潜在動的モデルの学習
使用扩展 Tchebyshev 函数将潜在动态模型学习为多目标优化
- DOI:
- 发表时间:2021
- 期刊:
- 影响因子:0
- 作者:幅田 加以瑛;丁 ミンヨン;神谷 拓;大森 一郎;小坂 浩隆;田上直樹,橋本健二;武田 俊季,小林 泰介,杉本 謙二
- 通讯作者:武田 俊季,小林 泰介,杉本 謙二
Reformulating Multi-Domain Reinforcement Learning under a Pseudo Multi-Objective Reinforcement Learning Framework
在伪多目标强化学习框架下重新构建多领域强化学习
- DOI:
- 发表时间:2022
- 期刊:
- 影响因子:0
- 作者:Ilboudo Wendyam Eric Lionel;Kobayashi Taisuke;Matsubara Takamitsu
- 通讯作者:Matsubara Takamitsu
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
小林 泰介其他文献
大域的最適解を目指すActor-Critic強化学習
Actor-Critic强化学习旨在全局最优解
- DOI:
- 发表时间:
2017 - 期刊:
- 影响因子:0
- 作者:
Toshiki Sugino;Taisuke Kobayashi;Kenji Sugimoto;Taisuke Kobayashi;小林 泰介 - 通讯作者:
小林 泰介
オフセット項付きフィードバック誤差学習による隊列走行の縦方向制御
使用带偏移项的反馈误差学习的队列垂直控制
- DOI:
- 发表时间:
2022 - 期刊:
- 影响因子:0
- 作者:
中尾 安宏;永田 篤樹;小林 泰介;杉本 謙二 - 通讯作者:
杉本 謙二
機械学習の可能性
机器学习的潜力
- DOI:
- 发表时间:
2022 - 期刊:
- 影响因子:0
- 作者:
計測自動制御学会;浮田 浩行;濱上 知樹;藤吉 弘亘;大町 真一郎;戸田 智基;岩崎 敦;小林 泰介;鈴木 亮太;木村 雄喜;橋本 大樹;玉垣 勇樹;水谷 麻紀子;永田 毅;木村 光成;李 晃伸;川嶋 宏彰 - 通讯作者:
川嶋 宏彰
パラメータの定着とスパース化を統合した正則化による継続学習
使用集成参数固定和稀疏化的正则化进行持续学习
- DOI:
- 发表时间:
2019 - 期刊:
- 影响因子:0
- 作者:
Canete;Luis;Taisuke Kobayashi;Taisuke Kobayashi and Toshiki Sugino;杉野 峻生,小林 泰介,杉本 謙二;小林 泰介 - 通讯作者:
小林 泰介
フラクタルリザーバコンピューティングを用いた継続学習
使用分形储层计算进行持续学习
- DOI:
- 发表时间:
2018 - 期刊:
- 影响因子:0
- 作者:
Canete;Luis;Taisuke Kobayashi;Taisuke Kobayashi and Toshiki Sugino;杉野 峻生,小林 泰介,杉本 謙二;小林 泰介;杉野 峻生,小林 泰介,杉本 謙二 - 通讯作者:
杉野 峻生,小林 泰介,杉本 謙二
小林 泰介的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('小林 泰介', 18)}}的其他基金
ヒューマノイドロボットにおける複数の制御手法の特徴を活用した歩行・走行制御の統一
利用仿人机器人多种控制方法的特点实现步行与跑步控制的统一
- 批准号:
16J05354 - 财政年份:2016
- 资助金额:
$ 11.15万 - 项目类别:
Grant-in-Aid for JSPS Fellows
相似海外基金
ハイパースペクトラルイメージングと深層学習を用いた皮膚病変鑑別システムの開発
利用高光谱成像和深度学习开发皮肤病变判别系统
- 批准号:
24K15777 - 财政年份:2024
- 资助金额:
$ 11.15万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
深層学習を用いた超音波画像からのSPIDDM診断支援システムの開発
使用深度学习从超声图像开发 SPIDDM 诊断支持系统
- 批准号:
24K15775 - 财政年份:2024
- 资助金额:
$ 11.15万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
深層学習を用いた拡散テンソル画像による腰椎疾患における疼痛の自動診断システム
基于深度学习的弥散张量图像腰椎疾病疼痛自动诊断系统
- 批准号:
24K15787 - 财政年份:2024
- 资助金额:
$ 11.15万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
幾何学的深層学習による非線形力学系のグレーボックスモデル化技術の創出
使用几何深度学习创建非线性动力系统灰盒建模技术
- 批准号:
24K15105 - 财政年份:2024
- 资助金额:
$ 11.15万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
アナログ回路に基づく進化計算手法による深層学習モデルの最適化
基于模拟电路的进化计算方法优化深度学习模型
- 批准号:
24K15115 - 财政年份:2024
- 资助金额:
$ 11.15万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
ダイナミクス情報を考慮した深層学習技術による天然変性タンパク質複合体構造予測
使用深度学习技术考虑动力学信息预测自然变性蛋白质复合物的结构
- 批准号:
24K15183 - 财政年份:2024
- 资助金额:
$ 11.15万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
地域連携プログラミング初等教育における深層学習やVRを用いた対話的学習支援システム
区域协作编程 在基础教育中使用深度学习和 VR 的交互式学习支持系统
- 批准号:
24K15230 - 财政年份:2024
- 资助金额:
$ 11.15万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
深層学習とドローンを用いた温室トマトの株毎の生育データモニタリングシステム
使用深度学习和无人机的每个温室番茄植株的生长数据监测系统
- 批准号:
24K15072 - 财政年份:2024
- 资助金额:
$ 11.15万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Developing and Visualising a Retrieval-Augmented Deep Learning Model for Population Health Management
开发和可视化用于人口健康管理的检索增强深度学习模型
- 批准号:
2905946 - 财政年份:2024
- 资助金额:
$ 11.15万 - 项目类别:
Studentship
Navigating Chemical Space with Natural Language Processing and Deep Learning
利用自然语言处理和深度学习驾驭化学空间
- 批准号:
EP/Y004167/1 - 财政年份:2024
- 资助金额:
$ 11.15万 - 项目类别:
Research Grant