評価と動作の並列学習により障害回避を自己形成する自律能動学習機械の研究

通过评估和动作并行学习自我形成避障的自主主动学习机研究

基本信息

  • 批准号:
    07780305
  • 负责人:
  • 金额:
    $ 0.77万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
  • 财政年份:
    1995
  • 资助国家:
    日本
  • 起止时间:
    1995 至 无数据
  • 项目状态:
    已结题

项目摘要

本研究は、ニューラルネットを用いた遅延強化学習の問題において、障害回避をいかに学習させるか、多数のセンサ細胞から信号が送られてくる場合にどのように処理するかの大きな2つのテーマに沿って進めてきた。前者については、最初に、ロボットが目標物を捕らえるという問題で、障害物を一般化し、ロボットと目標物との空間的な位置関係によってロボットの動作特性を変化させた場合のシミュレーションを行った。これにより、従来のように、目的の達成にいかに近いかを表す評価関数を、それ自体の時間の2階微分値を0に近づけるという学習させるだけでは、ロボットが目標物までの最適なパスを獲得できないことが判明した。その後の解析から、試行毎に評価関数の時間変化の傾き(1階微分値)が変化し、正しい評価が行えないという状況であることがわかった。そこで、評価関数の1階微分値の時間平均を保持し、1階微分値がその値に近づくように学習を行うという方法を考案し、シミュレーションによって確認した。また、試行錯誤の方法を工夫して障害物回避に利用するという問題については、試行錯誤に用いる乱数の振幅を学習させる方法を試みたが、現在のところまだうまくいっていない。一方、多数のセンサ細胞から信号が得られる場合について、それを統合化し、強化学習に使いやすい形に変換することを学習できないかを試みた。そして、空間の情報が時間的に滑らかであるという仮説から、多数のセンサ信号を入力とするニューラルネットの出力の時間の2階微分値を0に近づけるという学習によって、多数のセンサ信号を統合したアナログ出力を学習によって得ることを提案した。そして、網膜細胞が1次元に30個配列されている状態で、目の前を物体が単振動をしている状況でシミュレーションを行ったところ、外部から教師信号を与えることなく、学習によって、ニューラルネットの出力が物体の位置を表すようになった。
This study focuses on the problem of delayed reinforcement learning, obstacle avoidance, and the processing of most cellular signals. The former refers to the problem of object capture, object generalization, object spatial positional relationship, object motion characteristics, etc. For example, if you want to learn from the second order derivative of the time, you can use it to determine the optimal value of the target. After the analysis, try to evaluate the relevant number of time to change the tilt (1st order differential value), change, positive evaluation, change the situation. The time average of the first order derivative of the relevant number is maintained, and the first order derivative is determined by the method of study. Try the wrong method, try the wrong method, try the wrong method. One side, the majority of the cells are separated from the other side, and the other side is separated from the other side. The second derivative of the output time of the spatial signal is 0. The second derivative of the output time of the spatial signal is 0. In addition, the retina cells are arranged in 30 dimensions, and the objects are arranged in a state of vibration. The objects are arranged in a state of vibration.

项目成果

期刊论文数量(4)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
柴田克成他: "相関情報抽出ネットと空間認識能力の教師なし学習" 日本神経回路学会誌. (掲載予定). (1996)
Katsunari Shibata 等人:“相关信息提取网络和空间识别能力的无监督学习”,日本神经网络学会杂志(待出版)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
柴田克成他: "相関情報抽出ネットによるステレオ画像上物体の奥行き情報抽出の教師なし学習" 日本神経回路学会全国大会講演論文集. 231-232 (1995)
Katsunari Shibata 等人:“使用相关信息提取网络提取立体图像中对象的深度信息的无监督学习”日本神经网络学会全国会议记录 231-232 (1995)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

柴田 克成其他文献

柴田 克成的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('柴田 克成', 18)}}的其他基金

Establishment of Chaos-based Dynamic Reinforcement Learning as Taking an Essential Technology to Realize Emergence of Thinking in Advance
建立基于混沌的动态强化学习作为实现超前思维生成的关键技术
  • 批准号:
    20K11993
  • 财政年份:
    2020
  • 资助金额:
    $ 0.77万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
実ロボットによるDirect-Vision-Based強化学習の検証
使用真实机器人验证基于直接视觉的强化学习
  • 批准号:
    13780295
  • 财政年份:
    2001
  • 资助金额:
    $ 0.77万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
センサ信号統合化学習と強化学習の融合に関する研究
传感器信号集成学习与强化学习融合研究
  • 批准号:
    08233204
  • 财政年份:
    1996
  • 资助金额:
    $ 0.77万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas

相似海外基金

鳥類における精子受精能力維持メカニズム:分子スイッチ調節による凍結障害回避
维持鸟类精子受精能力的机制:通过调节分子开关避免冷冻损伤
  • 批准号:
    23K21280
  • 财政年份:
    2024
  • 资助金额:
    $ 0.77万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
CCSS: FLASH: Drone Obstacle Avoidance with Event Cameras: Bio-Inspired Architecture, Algorithm, and Platform
CCSS:FLASH:使用事件相机进行无人机避障:仿生架构、算法和平台
  • 批准号:
    2302724
  • 财政年份:
    2023
  • 资助金额:
    $ 0.77万
  • 项目类别:
    Standard Grant
Enhancing Autonomy and Decision-Making Capabilities of an Obstacle Avoidance System for Autonomous Underwater Vehicles Operating Under Ice
增强冰下自主水下航行器避障系统的自主性和决策能力
  • 批准号:
    2757066
  • 财政年份:
    2022
  • 资助金额:
    $ 0.77万
  • 项目类别:
    Studentship
Visual Control of Steering, Obstacle Avoidance, and Path Following
转向、避障和路径跟踪的视觉控制
  • 批准号:
    2218220
  • 财政年份:
    2022
  • 资助金额:
    $ 0.77万
  • 项目类别:
    Standard Grant
Constrained Model Predictive Control for Obstacle Avoidance in Unstructured Environments
非结构化环境中避障的约束模型预测控制
  • 批准号:
    576009-2022
  • 财政年份:
    2022
  • 资助金额:
    $ 0.77万
  • 项目类别:
    Alexander Graham Bell Canada Graduate Scholarships - Master's
鳥類における精子受精能力維持メカニズム:分子スイッチ調節による凍結障害回避
维持鸟类精子受精能力的机制:通过调节分子开关避免冷冻损伤
  • 批准号:
    21H02377
  • 财政年份:
    2021
  • 资助金额:
    $ 0.77万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
プラチナ系抗がん薬による腎障害回避を目的とした新規尿中バイオマーカーの臨床応用
新型尿液生物标志物的临床应用以避免铂类抗癌药物引起的肾损伤
  • 批准号:
    21K06662
  • 财政年份:
    2021
  • 资助金额:
    $ 0.77万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Synchronization of UAV Swarms for Indoor Applications Under Obstacle-Avoidance Restrictions
避障限制下室内应用的无人机群同步
  • 批准号:
    560380-2020
  • 财政年份:
    2020
  • 资助金额:
    $ 0.77万
  • 项目类别:
    University Undergraduate Student Research Awards
Autonomous navigation, obstacle avoidance and target following for a UAV
无人机自主导航、避障和目标跟踪
  • 批准号:
    554524-2020
  • 财政年份:
    2020
  • 资助金额:
    $ 0.77万
  • 项目类别:
    University Undergraduate Student Research Awards
Adaptive locomotor adjustments for obstacle avoidance: the factors determining the timing of adjustments
避障自适应运动调整:决定调整时机的因素
  • 批准号:
    19K11466
  • 财政年份:
    2019
  • 资助金额:
    $ 0.77万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了