異種の学習マルチエージェント系に関する研究

异构学习多智能体系统研究

基本信息

  • 批准号:
    07243215
  • 负责人:
  • 金额:
    $ 1.41万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
  • 财政年份:
    1995
  • 资助国家:
    日本
  • 起止时间:
    1995 至 无数据
  • 项目状态:
    已结题

项目摘要

単純な決定規則で行動するエージェントを複数用意し,その間に蜜なインタラクションを持つような系を走らせ,全体の挙動が創発されるのを実験的に調べる研究が,物理,数学のみならず,人工知能,人工生命の研究において最近非常に活発に行われつつある.しかし,これまで扱われてきたエージェントは,非常に単純なものであり,その行動決定規則自身も静的で,設計者がある程度全体の挙動を予測可能であり,創発性という意味では,不十分な面がある.また,もう一つの重要な問題として,エージェントが同じ行動決定アルゴリズムをもつという意味で,均質であることがあげられる.以上の背景から,我々は,動的に自分自身の行動決定規則を変化させる学習機能をエージェントに持たせ,さらにその学習アルゴリズムが不均質であるようなマルチエージェント系を,様々な視点から構成し,個々のエージェントのパラメータの変化により,全体の挙動がいかに創発されるかを調べ,個が全体に及ぼす影響を実験的に探ることを目指した.初年度は,異なった強化学習アルゴリズムによる異種マルチエージェント系における種々の実験をおこなった.ここで,異なった強化学習アルゴリズムとは,Q学習において学習率と行動選択を変えたものを意味する.このパラメータの違うの学習アルゴリズムに注目し,それぞれのパラメータをもつエージェントを用意し、同じ環境で行動学習を行わせて学習マルチエージェント系を構成する.まずは,それぞれの学習アルゴリズムをもつ2つのエージェントから始めた.実際に実験に用いたエージェント間のハンタラクションは,以下のものである.経験の共有:各エージェントが実際に行動することにより経験した,状態-行動-報酬の3つ組を共有する.これは,各エージェントで同じ表現を用いて比較的素直に共有できる.実験の結果,特に局所最適解をもつ報酬において,2つの異種のエージェント間において相補性が見られた。
The pure decision rules, the actions, the multiple intentions, the time, the behavior, the system, the whole movement, the innovation, the real research, the physics, the mathematics, the artificial energy, the artificial life research, the recent extraordinary development. The designer has the ability to predict the overall motion of the whole body, which is possible, creative, and not very simple. This is an important issue, and it means that we are homogeneous in our actions. The above background, I, the movement of the division of their own action decision rules change, learning functions change, today's learning loss, uneven quality change, different point of view composition, individual change, the whole movement change, the creation of the adjustment, All of them. In the beginning of the year, different reinforcement learning was carried out. This means that different reinforcement learning methods can be used to improve learning efficiency. This study focuses on the study of the environment, and the study of the environment. In the end, we will continue to study and learn from each other. In practice, the following actions are taken: Total: 3 groups of actions, status-actions-compensation. The same performance can be achieved by comparing the elements of each element with each other. As a result, the optimal solution of the special bureau is to reduce the compensation, and the complementarity between the two different kinds of compensation is to be seen.

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

山田 誠二其他文献

ボーナス付きマッチングペニーゲームにおける人間からエージェントへの適応プロセスの解明
阐明奖金匹配便士游戏中人对智能体的适应过程
  • DOI:
  • 发表时间:
    2012
  • 期刊:
  • 影响因子:
    0
  • 作者:
    寺田 和憲;山田 誠二;伊藤 昭
  • 通讯作者:
    伊藤 昭
人とロボットの<間>をデザインする
设计人与机器人之间的空间
  • DOI:
  • 发表时间:
    2007
  • 期刊:
  • 影响因子:
    0
  • 作者:
    鈴木 路子編著;金子 勇・小林 保子・増田 敦・増野 知子著;江草由佳;江草由佳;江草由佳;Kazuki Kobayashi;Kazuki Kobayashi;小林 一樹;小林 一樹;Kazuki KOBAYASHI;小林 一樹;小林 一樹;小林 一樹;小林 一樹;Ikuko Kanashiro;小林 一樹;門脇 克典;石津 拓;Yasuhiko Kitamura;Yasuhiko Kitamura;Kazuki Kobayashi;小林 一樹;山田 誠二;山田 誠二
  • 通讯作者:
    山田 誠二
オンチップトーラス網における仮想チャネルフリールーティング
片上环面网络中的虚拟通道自由路由
  • DOI:
  • 发表时间:
    2006
  • 期刊:
  • 影响因子:
    0
  • 作者:
    鈴木 路子編著;金子 勇・小林 保子・増田 敦・増野 知子著;江草由佳;江草由佳;江草由佳;Kazuki Kobayashi;Kazuki Kobayashi;小林 一樹;小林 一樹;Kazuki KOBAYASHI;小林 一樹;小林 一樹;小林 一樹;小林 一樹;Ikuko Kanashiro;小林 一樹;門脇 克典;石津 拓;Yasuhiko Kitamura;Yasuhiko Kitamura;Kazuki Kobayashi;小林 一樹;山田 誠二;山田 誠二;Akito Sakurai;Michihiro Koibuchi;Daihan Wang;Yuri Nishikawa;Daihan Wang;Hiroki Matsutani;Akiya Jouraku;松谷 宏紀;西川 由理;山田 裕;松谷 宏紀
  • 通讯作者:
    松谷 宏紀
Experimental Comparison of Clustering Results for k-means by using different seeding methods
使用不同播种方法的 k 均值聚类结果的实验​​比较
  • DOI:
  • 发表时间:
    2011
  • 期刊:
  • 影响因子:
    0
  • 作者:
    崇司 小野田;坂井 美帆;山田 誠二
  • 通讯作者:
    山田 誠二
Document Retrieval based on Relevance Feedback with Active Learning (小特集 「アクティブマイニング」および一般)
基于主动学习的相关性反馈的文档检索(“主动挖掘”的小特征和一般)
  • DOI:
  • 发表时间:
    2003
  • 期刊:
  • 影响因子:
    0
  • 作者:
    崇司 小野田;村田 博士;山田 誠二
  • 通讯作者:
    山田 誠二

山田 誠二的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('山田 誠二', 18)}}的其他基金

AIに対する人間の過信・不信メカニズムの実験的解明と過不信予防AIへの応用
人工智能中人类过度自信/不信任机制的实验阐明及其在人工智能中防止过度自信的应用
  • 批准号:
    24H00731
  • 财政年份:
    2024
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)
エージェントの態度表出における外見と表現の関係の実験的解明
实验阐明代理人态度表达中的外表与表情之间的关系
  • 批准号:
    18650034
  • 财政年份:
    2006
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Exploratory Research
人間からペットロボットへの適応のためのインタラクション設計
人类适应宠物机器人的交互设计
  • 批准号:
    16650033
  • 财政年份:
    2004
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Exploratory Research
WWWにおけるメタ情報源の獲得
获取 WWW 上的元信息源
  • 批准号:
    13131203
  • 财政年份:
    2001
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
異種マルチロボット系におけるオペレータ生成とプラニングの統合
异构多机器人系统中算子生成和规划的集成
  • 批准号:
    11878059
  • 财政年份:
    1999
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Exploratory Research
環境変化に適応可能なプラニングの研究
适应环境变化的规划研究
  • 批准号:
    08780361
  • 财政年份:
    1996
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
異種の学習マルチエージェント系に関する研究
异构学习多智能体系统研究
  • 批准号:
    08233214
  • 财政年份:
    1996
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
環境の変化に適応可能な効率化学習の研究
适应环境变化的高效学习研究
  • 批准号:
    07780324
  • 财政年份:
    1995
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
実世界に耐えうる高速な機械学習の研究
研究能够承受现实世界的高速机器学习
  • 批准号:
    06780316
  • 财政年份:
    1994
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
インターリーブによるリアクティブ・プランニングの枠組み
具有交错功能的反应式规划框架
  • 批准号:
    04750334
  • 财政年份:
    1992
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)

相似海外基金

非線形マルチエージェント系の分散・集中型オブザーバ設計法の開発
非线性多智能体系统分布式/集中式观测器设计方法的发展
  • 批准号:
    22K04165
  • 财政年份:
    2022
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
マルチエージェント系に対するレジリエントな分散アルゴリズムの研究
多智能体系统弹性分布式算法研究
  • 批准号:
    21F20376
  • 财政年份:
    2021
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
非協力・利己的マルチエージェント系のための制御エージェント設計
非合作自私多智能体系统的控制智能体设计
  • 批准号:
    19K04440
  • 财政年份:
    2019
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
マルチエージェント系における情報量と制御性能の関係解明
阐明多智能体系统中信息内容与控制性能之间的关系
  • 批准号:
    12J08929
  • 财政年份:
    2012
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
マルチエージェント系における協調学習を介したシンボル獲得の実現
多智能体系统中通过协作学习实现符号获取
  • 批准号:
    13780270
  • 财政年份:
    2001
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
自己認識的マルチエージェント系としての構造的知識の形式化とその推論手法の比較
结构知识形式化为自我意识多智能体系统及其推理方法比较
  • 批准号:
    08780381
  • 财政年份:
    1996
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
異種の学習マルチエージェント系に関する研究
异构学习多智能体系统研究
  • 批准号:
    08233214
  • 财政年份:
    1996
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了