汎用ロボットの行動獲得のための目的主導型プログラミング言語
用于通用机器人行为获取的目的驱动编程语言
基本信息
- 批准号:10J09030
- 负责人:
- 金额:$ 0.9万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for JSPS Fellows
- 财政年份:2010
- 资助国家:日本
- 起止时间:2010 至 2011
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
本研究では,強化学習,機械学習,人工知能の分野で開発されてきた技術を,ヒューマノイドに代表される汎用ロボットの行動獲得に応用することを目的としている.具体的には,研究代表者が提案する「高度にモジュール化された強化学習システム」のインターフェイス言語として,「目的主導型プログラミング言語」の提案を課題とした.2011年度に得た成果は以下の通りである.1.高度にモジュール化された強化学習ライブラリSkyAIの強化: 提案システムをC++で実装し,オープンソースのソフトウェアライブラリとして公開している.本年度は,スクリプトインターフェイスの文法機能を強化し,SkyAI上で報酬の定義をしやすくした.この成果をskyai.orgで公開した.2.学習戦略フュージョン: 学習戦略をモジュール化しシステムが自動選択するような枠組みを開発した.この成果を国際会議Humanoids2011で発表した.この実験で使われたタスクは,匍匐タスク,旋回タスク,ナビゲーションタスクであり,これらのタスクはSkyAI上で記述された.つまり目的主導型プログラミング言語による記述であり,本課題が目指した「目的の記述による行動プログラミング」の達成が実験的に示されたといえる.3.高自由度ロボットのための行動空間生成手法DCOB: 研究代表者が開発している手法DCOBについて広範囲に実験を行い,自由度の拘束によって学習の傾向がどのように異なるか調べた.具体的には,3~7の自由度に拘束したシミュレーション上のヒューマノイドロボットによる匍匐タスクで検証した.さらに,4自由度の拘束条件では,匍匐タスクおよび旋回タスクを学習させ,報酬関数の違いのみで異なる動作が学習できることを実証した.いずれのタスクもSkyAI上で記述されている.これらの成果をDCOBの研究結果としてまとめて,国際誌に投稿中である.4.高自由度逆運動学の機械学習アプローチ: より高自由度の実用的問題に適用可能にするため,アンドロイドロボットの表情制御を機械学習の手法を応用して実現する研究を行った.
The purpose of this study is to strengthen the science of chemistry, mechanics, and artificial knowledge. In this study, the purpose of this study is to strengthen the chemistry, mechanics, and artificial knowledge. For specific information, the representative of the research proposed that the following information should be obtained in 2011. The following are the following results. High level of reinforcement.
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Inverse Kinematics Solver for an Android Face using Neural Network
使用神经网络的 Android 人脸逆运动学求解器
- DOI:
- 发表时间:2011
- 期刊:
- 影响因子:0
- 作者:守山浩史;田中大樹;松岡成居;熊田亜紀子;日高邦彦;田中大樹;D.Tanaka;作田真理子;D.Tanaka;田中大樹;山口明彦;Akihiko Yamaguchi;Emarc Magtanong
- 通讯作者:Emarc Magtanong
Fusing Learning Strategies to Learn Various Tasks with Single Configuration
融合学习策略,通过单一配置学习各种任务
- DOI:
- 发表时间:2011
- 期刊:
- 影响因子:0
- 作者:Etsuo Maeda;Jean-Jacques Delaunay;et al;Akihiko Yamaguchi
- 通讯作者:Akihiko Yamaguchi
SkyAI : Highly Modularized Reinforcement Learning Library-Concepts.Requirements, and Implementation-
SkyAI:高度模块化的强化学习库-概念、要求和实施-
- DOI:
- 发表时间:2010
- 期刊:
- 影响因子:0
- 作者:Etsuo Maeda;Jean-Jacques Delaunay;et al;Akihiko Yamaguchi
- 通讯作者:Akihiko Yamaguchi
Reinforcement Learning for Balancer Embedded Humanoid Locomotion
Balancer 嵌入式人形运动的强化学习
- DOI:
- 发表时间:2010
- 期刊:
- 影响因子:0
- 作者:Etsuo Maeda;Jean-Jacques Delaunay;et al;Akihiko Yamaguchi
- 通讯作者:Akihiko Yamaguchi
強化学習によるロボットの動作獲得のための基底関数に基づく行動空間生成手法DCOB-実機多自由度ロボットの匍匐動作への適用-
DCOB,一种基于基函数的强化学习获取机器人运动的行为空间生成方法 - 应用于实际多自由度机器人的爬行运动 -
- DOI:
- 发表时间:2010
- 期刊:
- 影响因子:0
- 作者:Etsuo Maeda;Jean-Jacques Delaunay;et al;山口明彦
- 通讯作者:山口明彦
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
山口 明彦其他文献
確率的モデルベース型強化学習における液体マニピュレーションのマルチモーダルダイナミクスの解析
基于随机模型的强化学习中液体操纵的多模态动力学分析
- DOI:
- 发表时间:
2021 - 期刊:
- 影响因子:0
- 作者:
八島 諒汰;山口 明彦;橋本 浩一 - 通讯作者:
橋本 浩一
性転換に伴うホシササノハベラの脳下垂体における生殖腺刺激ホルモン(GtH)mRNA発現量の変化
性别改变导致 Hoshisasanohabera 垂体促性腺激素 (GtH) mRNA 表达水平的变化
- DOI:
- 发表时间:
2008 - 期刊:
- 影响因子:0
- 作者:
入江 奨;北野 載;山口 明彦;太田 耕平;松山 倫也 - 通讯作者:
松山 倫也
人の把持行動に基づく物体操作データベースの構築手法
一种基于人类抓取行为的物体操纵数据库构建方法
- DOI:
- 发表时间:
2014 - 期刊:
- 影响因子:0
- 作者:
島田 健史;杉垣 彰教;山口 明彦;池田 篤俊;高松 淳;小笠原 司 - 通讯作者:
小笠原 司
視触覚センサFingerVisionを搭載した高機能ロボットハンド
配备视觉触觉传感器 FingerVision 的高性能机械手
- DOI:
- 发表时间:
2022 - 期刊:
- 影响因子:0
- 作者:
八島 諒汰;山口 明彦;橋本 浩一;山口 明彦 - 通讯作者:
山口 明彦
山口 明彦的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('山口 明彦', 18)}}的其他基金
Discrete and Continuous Reinforcement Learning with a Library of Skills and its Application to Robotic Food Manipulation
具有技能库的离散和连续强化学习及其在机器人食品操作中的应用
- 批准号:
21K12070 - 财政年份:2021
- 资助金额:
$ 0.9万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Development of the gonadotropin secretion promotion technique using the Tiger puffer pituitary spheroid culture
利用虎鲀垂体球培养促进促性腺激素分泌技术的开发
- 批准号:
21K05727 - 财政年份:2021
- 资助金额:
$ 0.9万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
機能的過負荷に伴う筋肥大、筋線維組成の変化に及ぼす局所的因子の影響
局部因素对肌肉肥大的影响以及功能超负荷引起的肌纤维组成的变化
- 批准号:
11780034 - 财政年份:1999
- 资助金额:
$ 0.9万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
機能的過負荷による骨格筋線維組成の変化に及ぼす神経の役割
神经在功能超负荷引起的骨骼肌纤维组成变化中的作用
- 批准号:
08780096 - 财政年份:1996
- 资助金额:
$ 0.9万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
相似海外基金
Learning to Reason in Reinforcement Learning
在强化学习中学习推理
- 批准号:
DP240103278 - 财政年份:2024
- 资助金额:
$ 0.9万 - 项目类别:
Discovery Projects
Collaborative Research: CDS&E: Generalizable RANS Turbulence Models through Scientific Multi-Agent Reinforcement Learning
合作研究:CDS
- 批准号:
2347423 - 财政年份:2024
- 资助金额:
$ 0.9万 - 项目类别:
Standard Grant
CAREER: Stochasticity and Resilience in Reinforcement Learning: From Single to Multiple Agents
职业:强化学习中的随机性和弹性:从单个智能体到多个智能体
- 批准号:
2339794 - 财政年份:2024
- 资助金额:
$ 0.9万 - 项目类别:
Continuing Grant
計測・通信品質が保証されない環境下の多目的フィードフォワード最適制御と強化学習
测量和通信质量无法保证环境下的多目标前馈最优控制和强化学习
- 批准号:
23K20948 - 财政年份:2024
- 资助金额:
$ 0.9万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
遅延を考慮した非同期分散型マルチモジュール・タイムスケール深層強化学習の開発
考虑延迟的异步分布式多模块时间尺度深度强化学习的开发
- 批准号:
23K21710 - 财政年份:2024
- 资助金额:
$ 0.9万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
強化学習を用いた分散制御によるネットワーク信号制御の最適化に関する研究
基于强化学习的分布式控制网络信号控制优化研究
- 批准号:
23K26216 - 财政年份:2024
- 资助金额:
$ 0.9万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
深層強化学習を用いた運動ノイズの影響を最小化する運動制御推定フレームワークの構築
使用深度强化学习构建运动控制估计框架,最大限度地减少运动噪声的影响
- 批准号:
24KJ2223 - 财政年份:2024
- 资助金额:
$ 0.9万 - 项目类别:
Grant-in-Aid for JSPS Fellows
強化学習モデル・ネットワーク分析によるサイコパシーの情報処理メカニズムの解明
利用强化学习模型和网络分析阐明精神病态的信息处理机制
- 批准号:
24K16865 - 财政年份:2024
- 资助金额:
$ 0.9万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
汎用かつ再利用可能な方策に基づく階層強化学習
基于通用和可重用策略的分层强化学习
- 批准号:
23K28140 - 财政年份:2024
- 资助金额:
$ 0.9万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
リスクの不確実性に対処する自律分散型マルチエージェント強化学習の研究開発
应对风险不确定性的自主分布式多智能体强化学习研发
- 批准号:
24K20873 - 财政年份:2024
- 资助金额:
$ 0.9万 - 项目类别:
Grant-in-Aid for Early-Career Scientists














{{item.name}}会员




