Study on Decentralized Learning Algorithms in Markovian Environments

马尔可夫环境下的分散学习算法研究

基本信息

  • 批准号:
    06650449
  • 负责人:
  • 金额:
    $ 1.34万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for General Scientific Research (C)
  • 财政年份:
    1994
  • 资助国家:
    日本
  • 起止时间:
    1994 至 1995
  • 项目状态:
    已结题

项目摘要

The results of this study are summarized as follows :(1) We proposed a new decentralized learning algorithm for Markov chains with unknown dynamics. A detailed simulation study revealed the feasibility of our algorithm and its superiority to the Q-learning scheme.(2) We proposed an object-oriented design support system for developing autonomous mobile robots. The usefulness of our support system was examined through some implementations of simulated and real robots. By using this support system, we also developed a robot which can acquire a proper setting of gain factors in an obstacle avoidance algorithm, called the VFH,by learning.(3) We applied the decentralized learning algorithm to the problem of adaptive action selection in an intelligent mobile robot. We employed a robot which has two photosensors to measure the light intensity in right or left direction. The robot's task is to learn an action selection policy for moving toward and getting to a light placed in any location of a room. The decentralized learning approach was successfully tested by running simulated robots, which were implemented by the object-oriented design support system.(4) We proposed a class of hierarchical systems called holon networks as general models for identification of nonlinear dynamical systems. Holon networks are able to evolve by self-organizing their structure and learn nonlinear systems without assuming much knowledge of them.
本研究的主要成果如下:(1)针对未知动态的马尔可夫链,提出了一种新的分散学习算法。详细的仿真研究表明了该算法的可行性及其相对于q -学习方案的优越性。(2)提出了面向对象的自主移动机器人开发设计支持系统。通过模拟和真实机器人的一些实现来检验我们的支持系统的实用性。利用该支撑系统,我们还开发了一种机器人,该机器人可以通过学习获得避障算法中适当的增益因子设置,称为VFH。(3)将分散学习算法应用于智能移动机器人的自适应动作选择问题。我们使用了一个机器人,它有两个光传感器来测量左右方向的光强度。机器人的任务是学习一种动作选择策略,以便移动到放置在房间任何位置的灯处。通过运行仿真机器人,对分散学习方法进行了验证,并由面向对象的设计支持系统实现。(4)提出了一类称为全息网络的分层系统作为非线性动力系统辨识的一般模型。Holon网络能够通过自组织其结构来进化,并且无需假设对非线性系统有太多的了解就可以学习非线性系统。

项目成果

期刊论文数量(42)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
釜谷博行: "学習オートマトンによる移動ロボットナビゲ-タのパラメータ自動調整" 電気学会論文誌. 115-C. 1570-1571 (1995)
Hiroyuki Kamaya:“使用学习自动机自动调整移动机器人导航器”,日本电气工程师学会汇刊 115-C 1570-1571 (1995)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
N.Honma: "On Autonomous Decentralized Evolution of Holon Network" Proc.of The 9th KACC Int'l Session. 498-503 (1994)
N.Honma:“论 Holon 网络的自主去中心化演化”第 9 届 KACC 国际会议议程。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
H.Honma: "Adaptive Evolution of Holon Networks by an Autonomous Decentralizes Method" International Symposium on Artificial Life. (1996)
H.Honma:“通过自主分散方法实现 Holon 网络的自适应进化”国际人工生命研讨会。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
本間経康: "自律分散的適応制御によるホロンネットワークの進化について" 計測自動制御学会論文集. 31(印刷中). (1995)
Tsuneyasu Honma:“论通过自主分散自适应控制的全子网络的演化”,仪器与控制工程师学会汇刊 31(出版中)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
釜谷 博行: "オブジェクト指向設計に基づいた自律型移動ロボットの開発支援システム" 電気学会論文誌. 115-C. 819-828 (1995)
Hiroyuki Kamaya:“基于面向对象设计的自主移动机器人的开发支持系统”日本电气工程师学会汇刊 115-C 819-828(1995)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

ABE Kenichi其他文献

視覚のジオポリティクス : メディアウォールを突き崩す
视野地缘政治:打破媒体墙
  • DOI:
  • 发表时间:
    2005
  • 期刊:
  • 影响因子:
    0
  • 作者:
    西谷 修;西谷 修;西谷 修;西谷 修;西谷 修;西谷 修;西谷 修;西谷 修;西谷 修;中山 智香子;安村 直己;林 みどり;大川 正彦;NISHITANI Osamu;NISHITANI Osamu;NISHITANI Osamu;NISHITANI Osamu;NISHITANI Osamu;NISHITANI Osamu;NISHITANI Osamu;NISHITANI Osamu;NISHITANI Osamu;NISHITANI Osamu;NISHITANI Osamu;NISHITANI Osamu;NISHITANI Osamu;NAKAYAMA Chikako;YASUMURA Naoki;HAYASHI Midori;OKAWA Masahiko;安村 直己;林 みどり;林 みどり;阿部 賢一;YASUMURA Naoki;HAYASHI Midori;林 みどり;安村 直己;阿部 賢一;ABE Kenichi;西谷 修・中山智香子(編集)
  • 通讯作者:
    西谷 修・中山智香子(編集)
鎮圧の後で
镇压后
  • DOI:
  • 发表时间:
    2004
  • 期刊:
  • 影响因子:
    0
  • 作者:
    NISHITANI Osamu;NAKAYAMA Chikako (as editors);田島 達也;川村邦光;田島 達也;NAKAYAMA Chikako;荻野美穂;成澤 勝嗣;NAKAYAMA Chikako;NAKAYAMA Chikako;島薗 進;五十嵐 公一;HAYASHI Midori;YONETANI Masafumi;杉原 達;五十嵐 公一;YONETANI Masafumi;野口 剛;中村生雄;井田 太郎;YONETANI Masafumi;赤坂 憲雄;大久保 純一;ABE Kenichi;Junichi Okubo;池上 良正;ABE Kenichi;島薗 進;並木 誠士;ABE Kenichi;Seishi Namiki;島薗 進;SAKAI Takashi;玉蟲 敏子;SAKAI Takashi;玉蟲 敏子;冨山 一郎;Satoko Tamamushi;SAKAI Takashi;冨山 一郎
  • 通讯作者:
    冨山 一郎
理性の探求(5)名づけと所有--アメリカという制度空間
理性探寻(五)命名与所有权--美国的制度空间
  • DOI:
  • 发表时间:
    2005
  • 期刊:
  • 影响因子:
    0
  • 作者:
    NISHITANI Osamu;NAKAYAMA Chikako (as editors);田島 達也;川村邦光;田島 達也;NAKAYAMA Chikako;荻野美穂;成澤 勝嗣;NAKAYAMA Chikako;NAKAYAMA Chikako;島薗 進;五十嵐 公一;HAYASHI Midori;YONETANI Masafumi;杉原 達;五十嵐 公一;YONETANI Masafumi;野口 剛;中村生雄;井田 太郎;YONETANI Masafumi;赤坂 憲雄;大久保 純一;ABE Kenichi;Junichi Okubo;池上 良正;ABE Kenichi;島薗 進;並木 誠士;ABE Kenichi;Seishi Namiki;島薗 進;SAKAI Takashi;玉蟲 敏子;SAKAI Takashi;玉蟲 敏子;冨山 一郎;Satoko Tamamushi;SAKAI Takashi;冨山 一郎;西谷 修;Satoko Tamamushi;玉蟲 敏子;中村生雄;西谷 修
  • 通讯作者:
    西谷 修
A Tikopia in the Global Era : Using Mediation to Empower Coffee Growing Communities in East Timor
全球时代的提科皮亚:利用调解为东帝汶咖啡种植社区赋权
  • DOI:
  • 发表时间:
    2009
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Tarsitani;Belle Asante;ABE Kenichi
  • 通讯作者:
    ABE Kenichi
暴力の哲学
暴力哲学
  • DOI:
  • 发表时间:
    2004
  • 期刊:
  • 影响因子:
    0
  • 作者:
    西谷 修;西谷 修;西谷 修;西谷 修;西谷 修;西谷 修;西谷 修;西谷 修;西谷 修;中山 智香子;安村 直己;林 みどり;大川 正彦;NISHITANI Osamu;NISHITANI Osamu;NISHITANI Osamu;NISHITANI Osamu;NISHITANI Osamu;NISHITANI Osamu;NISHITANI Osamu;NISHITANI Osamu;NISHITANI Osamu;NISHITANI Osamu;NISHITANI Osamu;NISHITANI Osamu;NISHITANI Osamu;NAKAYAMA Chikako;YASUMURA Naoki;HAYASHI Midori;OKAWA Masahiko;安村 直己;林 みどり;林 みどり;阿部 賢一;YASUMURA Naoki;HAYASHI Midori;林 みどり;安村 直己;阿部 賢一;ABE Kenichi;西谷 修・中山智香子(編集);西谷 修・中山智香子(共編著);NISHITANI Osamu;大川 正彦;酒井 隆史
  • 通讯作者:
    酒井 隆史

ABE Kenichi的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('ABE Kenichi', 18)}}的其他基金

Studies on Literary History in Bohemia
波西米亚文学史研究
  • 批准号:
    19K00493
  • 财政年份:
    2019
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Studies on Images of "East" in East European Literature
东欧文学中的“东”意象研究
  • 批准号:
    24320064
  • 财政年份:
    2012
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Self-Organization of Hierarchical Reinforcement Learning System
分层强化学习系统的自组织
  • 批准号:
    13650480
  • 财政年份:
    2001
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Self-control of Memory Structure of Reinforcement Learning in Hidden Markov Environments
隐马尔可夫环境下强化学习记忆结构的自我控制
  • 批准号:
    11650441
  • 财政年份:
    1999
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Study on Decentralized Learning Algorithms in Non-Markovian Environments
非马尔可夫环境下的分散学习算法研究
  • 批准号:
    09650451
  • 财政年份:
    1997
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)

相似海外基金

Learning automaton in a non-stationary environment - Towards the effective use of soft computing -
非平稳环境中的学习自动机 - 迈向软计算的有效利用 -
  • 批准号:
    23500277
  • 财政年份:
    2011
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Reinforcement of the Performances of the Soft Computing Techniques & Utilization of the learning Automaton-Challenges Toward Nonstationary Environment
软计算技术性能的强化
  • 批准号:
    18500173
  • 财政年份:
    2006
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了