センサ信号統合化学習と強化学習の融合に関する研究
传感器信号集成学习与强化学习融合研究
基本信息
- 批准号:08233204
- 负责人:
- 金额:$ 1.92万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research on Priority Areas
- 财政年份:1996
- 资助国家:日本
- 起止时间:1996 至 无数据
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
本研究では、センサ信号統合化学習と強化学習を融合することにより、視覚センサのように、局所的な受容野しか持たない多数のセンサセルの信号から目的達成のための動作の生成法を学習によって柔軟かつ効率的に獲得することを目指した。強化学習の中で、目的達成までの所要時間を現在の状態から予測することを学習するために、筆者らはニューラルネットを用いて予測(評価)値を計算させ、時間による2階微分値を0に近づけるという時間軸スムージング学習によってそのニューラルネットを学習させてきた。しかし、本研究を進めることにより、複数経路での評価等を考慮すると、予測値の時間の2階微分値を0にするだけでなく、時間変化量を一定化することが必要であることがわかった。さらに、時間変化量を一定にする学習において、現在の予測値を基準に、過去の予測値を学習させるという方法を採る必要があることもわかった。そして、この方法を用いることにより、結果的に、センサ信号の統合化学習を用いなくても、視覚センサ信号を直接強化学習で扱うことができることがわかった。従来、視覚センサ信号を用いて強化学習をさせる場合には、視覚センサ信号を人間が作ったプログラムにより前処理し、複数の離散な状態空間に分割して、各状態に対する動作を学習させてきた。従って、適応性という点で問題があった。しかし、本方法を用いることにより、単純な問題の場合には、視覚センサ信号を直接入力しても学習できることがわかった。そして、その際にニューラルネットの中間層ニューロンが、局所的な受容野しか持たないセンサの信号を統合し、空間情報を効率的に表現していることがわかった。また、システムの動作特性を変えてシミュレーションすることにより、中間層ニューロンが、学習に必要な部分を拡大して表現するといった適応能力があることがわかった。
This research is based on signal integrated learning and reinforcement learning integration, visual signal integration learning and reinforcement learning, visual signal integration learning, and the bureau's acceptance of the field.い Many のセンサセルの Signal から Purpose achieved のための Action の Generating method を Learning によって Soft かつ に Gain するこ とを Eye finger した. The middle part of reinforcement learning, the time required to achieve the goal, the current state, and the predictionことを学するために、The author らはニューラルネットを用いて Pre-test (review価) Value calculationさせ、Timeによる2nd order differential valueを0にNearlyづけるというTime Axis スムージングlearn によってそのニューラルネットをlearn させてきた.しかし、This research progressめることにより、Plural 経路でのvaluation価etc.をConsiderationすると、Predicted value のTimeの2 The order differential value を0にするだけでなく, the time changing quantity をa certain することがnecessary であることがわかった.さらに、The amount of time change is certain にするLearning において、The current estimated value をbaselineに、 In the past, it is necessary to learn the method of learning the させるという.そして, この method を use いることにより, result に, センサ signal のintegrated learning を useいなくても、See 覚センサ Signal をDirect reinforcement learning でうことができることがわかった. Come on, see the signal of the world, use the reinforcement learning of the occasion, see the signal of the world, and do the work of the world. Pre-processing of the data, segmentation of the complex discrete state space, and learning of each state's actions. There is a problem with the adaptability and adaptability.しかし、This method is used in いることにより、Simple problem and situation には、 According to the signal of 覚センサ, the direct input of the force is the learning function.そして, その记にニューラルネットの中layer ニューロンが, bureau's な Acceptance No. しか木The integration of signals and space intelligence and the efficiency of space intelligence are demonstrated.また, システムのaction characteristics を変えてシミュレーションすることにより, middle layer ニューロンが, learning is necessary, part of it is necessary, performance is good, and ability is suitable.
项目成果
期刊论文数量(8)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
柴田 克成: "相関情報抽出ネットと空間認識能力の教師なし学習" 日本神経回路学会誌. 3巻・1号. 11-16 (1996)
Katsunari Shibata:“相关信息提取网络和空间识别能力的无监督学习”日本神经网络学会杂志第3卷第1.11-16号(1996)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
柴田 克成: "視覚センサ信号を入力とした遅延強化学習" 日本神経回路学会 第7回全国大会講演論文集. 144-145 (1996)
Katsunari Shibata:“使用视觉传感器信号作为输入的延迟强化学习”日本神经网络学会第七届全国会议记录 144-145 (1996)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
柴田 克成: "強化学習による能動認識能力の学習" 日本神経回路学会誌. 3巻・4号. 126-134 (1996)
Katsunari Shibata:“通过强化学习学习主动识别能力”日本神经网络学会杂志第 3 卷,第 4 期。126-134(1996 年)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
柴田 克成: "時間軸スムージング学習と局所センサ信号の統合" 日本神経回路学会 第7回全国大会講演論文集. 178-179 (1996)
Katsunari Shibata:“局部传感器信号的时间平滑学习和集成”日本神经网络学会第七届全国会议记录 178-179 (1996)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
K.Shibata: "Reinforcement Leavning when Viasual Sensory Signals are Directly Given as InPuts" Proc.of ICNN'97. (1997)
K.Shibata:“当通过视觉感觉信号直接作为输入给出时的强化Leavning”Proc.of ICNN97。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
柴田 克成其他文献
柴田 克成的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('柴田 克成', 18)}}的其他基金
Establishment of Chaos-based Dynamic Reinforcement Learning as Taking an Essential Technology to Realize Emergence of Thinking in Advance
建立基于混沌的动态强化学习作为实现超前思维生成的关键技术
- 批准号:
20K11993 - 财政年份:2020
- 资助金额:
$ 1.92万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
実ロボットによるDirect-Vision-Based強化学習の検証
使用真实机器人验证基于直接视觉的强化学习
- 批准号:
13780295 - 财政年份:2001
- 资助金额:
$ 1.92万 - 项目类别:
Grant-in-Aid for Young Scientists (B)
評価と動作の並列学習により障害回避を自己形成する自律能動学習機械の研究
通过评估和动作并行学习自我形成避障的自主主动学习机研究
- 批准号:
07780305 - 财政年份:1995
- 资助金额:
$ 1.92万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)














{{item.name}}会员




