実ロボットによるDirect-Vision-Based強化学習の検証
使用真实机器人验证基于直接视觉的强化学习
基本信息
- 批准号:13780295
- 负责人:
- 金额:$ 1.54万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Young Scientists (B)
- 财政年份:2001
- 资助国家:日本
- 起止时间:2001 至 2002
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
昨年度、リニアの視覚センサ付きの小型移動ロボットを用いて、Direct-Vision-Based強化学習に基づき、単に視覚センサ信号をニューラルネットを入力し、円柱状の黒い物体に到達した際の報酬を元に、強化学習を行うだけで、物体に到達する行動を獲得できることを示した。しかしながら、視覚センサはリニアタイプのものである上、入力の信号数は64と少なかった。そこで、今年度は、説得力を増すため、まず、リニアの視覚センサの代わりに、超小型CCDカメラを装着して、二次元画像で信号数1536という状況で、同様に物体到達運動が学習できるかを検証した。そして、試行回数の増大もほとんどなく、学習できることを確認した。しかしながら、これでも、単に到達するだけでは画像上の黒い部分の重心を画面の中心で捕らえ、前進するという簡単な制御でも実現でき、タスクとして簡単であるため、より難しいタスクとして、横に寝かせた細長い直方体の物体を押すタスクを行った。この場合、単に到達するだけでなく、バランスを取って押すこと、さらには、単に物体に近づくだけでなく、その後に押すことを考慮して近づくことが必要となる。その結果、単に、物体を押したときに報酬を与え、見失ったときに罰を与えて数千試行の学習をさせるだけで、物体に近づいて押すことができるようになった。そして、画像上の物体の重心が同一であっても、物体の向きによって、近づき方も異なったものとなった。また、当初は、直方体の長辺に対して垂直に近づいて押すようになることを想定していたが、実際の学習後の行動は、予想とは異なっており、物体の滑りも考慮し、当初想定していた経路よりも短時間で物体を押して報酬を得るようになった。このように、画像処理も制御方法もタスクに関する情報も一切与えずに、物体を押す動作を学習によって獲得できることを示したのは、筆者が知る限り、世界でも本研究が初めてである。
Last year, we paid for the use of small-scale transportation equipment, the use of Direct-Vision-Based, the strength of the chemical signal, the input force of the column-shaped black object, the cost of the payroll, the safety of the chemical company, and the arrival of the object. The number of input signals is less than the number of input signals. The number of secondary portrait signals is 1536, the number of two-dimensional portraits is 1536, and the number of objects in the same direction is similar to that of objects in the same class. Please make sure that you do not know if you want to make sure that you do not know what to do. In the picture, the center of gravity is in the center of the picture, and the center of gravity is captured in the center of the picture on the portrait, so that you can make sure that you see the image, and that you can make sure that you see the image, and that you can make sure that you don't know what's going on, and that you're going to make sure that you don't know what's going on, and that you're going to make sure that you have a square object in front of you. Make sure you don't know what's going on, so that you can pick up the objects that are close to you, and then you'll need to know if it's necessary. The result, the result, the object, the price, the result, the price, the price and the price. The center of gravity of the object in the portrait is the same as that in the portrait, and the object is in the direction of the object. You want to buy a car, you want to do it, you don't want to do it, and you want to do it. The method of making and controlling the portrait, the way to control it, the method to control it, the way to control
项目成果
期刊论文数量(3)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
前原 伸一, 杉坂 政典, 柴田 克成: "移動物体の捕獲行動学習におけるセンサ動作の比較"電子情報通信学会技術報告,ニューロコンピューティング研究会. (発表予定). (2002)
Shinichi Maehara、Masanori Sugisaka、Katsunari Shibata:“学习移动物体捕获行为的传感器操作比较”IEICE 技术报告,神经计算研究小组(即将提交)(2002 年)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
飯田大, 杉坂政典, 柴田克成: "Direct-Vision-Based強化学習による小型CCDカメラ付き移動ロボットの行動獲得"第21回計測自動制御学会九州支部学術講演会予稿集. 109-112 (2002)
Dai Iida、Masanori Sugisaka、Katsunari Shibata:“使用基于直接视觉的强化学习来获取配备有小型 CCD 相机的移动机器人的行为”第 21 届仪器与控制工程师学会九州分会学术会议论文集 109-。 112(2002)
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
柴田 克成, 伊藤 宏司: "局所信号を入力としたニューラルネットの中間層における適応的空間再構成と汎化"電子情報通信学会技術報告,ニューロコンピューティング研究会. (発表予定). (2002)
Katsunari Shibata、Hiroshi Ito:“使用局部信号作为输入的神经网络中间层的自适应空间重建和泛化”,IEICE 技术报告,神经计算研究组(即将提交)(2002 年)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
柴田 克成其他文献
柴田 克成的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('柴田 克成', 18)}}的其他基金
Establishment of Chaos-based Dynamic Reinforcement Learning as Taking an Essential Technology to Realize Emergence of Thinking in Advance
建立基于混沌的动态强化学习作为实现超前思维生成的关键技术
- 批准号:
20K11993 - 财政年份:2020
- 资助金额:
$ 1.54万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
センサ信号統合化学習と強化学習の融合に関する研究
传感器信号集成学习与强化学习融合研究
- 批准号:
08233204 - 财政年份:1996
- 资助金额:
$ 1.54万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
評価と動作の並列学習により障害回避を自己形成する自律能動学習機械の研究
通过评估和动作并行学习自我形成避障的自主主动学习机研究
- 批准号:
07780305 - 财政年份:1995
- 资助金额:
$ 1.54万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
相似海外基金
Analysis of cognitive maps and their memory generated from combinations of multi modalities.
分析多模态组合生成的认知图及其记忆。
- 批准号:
23K16962 - 财政年份:2023
- 资助金额:
$ 1.54万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
Establishment of a pre-depression biomarker using EEG analysis with shallow learning and its application to the early treatment of depression
浅层学习脑电图分析抑郁症前期生物标志物的建立及其在抑郁症早期治疗中的应用
- 批准号:
23K17457 - 财政年份:2023
- 资助金额:
$ 1.54万 - 项目类别:
Grant-in-Aid for Challenging Research (Pioneering)
遷移型時系列生成ニューラルネットの提案と医用データ応用
过渡时间序列生成神经网络的提出及其在医学数据中的应用
- 批准号:
23K16995 - 财政年份:2023
- 资助金额:
$ 1.54万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
Automatic reporting system of current weather information using drive recorder images
使用行车记录仪图像自动报告当前天气信息的系统
- 批准号:
23K11234 - 财政年份:2023
- 资助金额:
$ 1.54万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
カオス的なニューラルネットにおける動的入力への同期によるパターン認識の研究
混沌神经网络动态输入同步模式识别研究
- 批准号:
23K11259 - 财政年份:2023
- 资助金额:
$ 1.54万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Multi-Disciplinary AI Computing Platform Based on Hyper-dimensional Vector Representation
基于超维向量表示的多学科人工智能计算平台
- 批准号:
23H05489 - 财政年份:2023
- 资助金额:
$ 1.54万 - 项目类别:
Grant-in-Aid for Scientific Research (S)
未学習クラス推定深層確率ニューラルネットの提案と自動的作業記録生成への応用
用于估计未学习类别的深度概率神经网络的提议及其在自动工作记录生成中的应用
- 批准号:
23K16935 - 财政年份:2023
- 资助金额:
$ 1.54万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
生体信号認識課題における被験者・計測状況を踏まえた深層学習処理の切替機構の開発
开发生物信号识别任务中基于主体和测量条件的深度学习处理切换机制
- 批准号:
23K16988 - 财政年份:2023
- 资助金额:
$ 1.54万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
軌道アトラクタを用いた自己位置推定と神経回路の相互作用によるナビゲーション
基于使用轨迹吸引子和神经回路相互作用的自定位的导航
- 批准号:
22K12208 - 财政年份:2022
- 资助金额:
$ 1.54万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Quantitative Modeling for the Neural Basis of Mathematical Ability
数学能力神经基础的定量建模
- 批准号:
20K07718 - 财政年份:2022
- 资助金额:
$ 1.54万 - 项目类别:
Grant-in-Aid for Scientific Research (C)














{{item.name}}会员




