Realtime Search for Learning Autonomous Agents

实时搜索学习自主代理

基本信息

  • 批准号:
    06452402
  • 负责人:
  • 金额:
    $ 4.86万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
  • 财政年份:
    1994
  • 资助国家:
    日本
  • 起止时间:
    1994 至 1996
  • 项目状态:
    已结题

项目摘要

Existing search algorithms can be divided into two classes : offline search such as A^<**>, and realtime search such as Real-Time-A^<**> (RTA^<**>) and Learning Real-Time-A^<**> (LRTA^<**>). Offline search completely examines every possible path to the goal state before executing that path, while realtime search makes each decision in a constant time, and commits its decision to the physical world. The problem solver eventually reaches the goal by repeating the cycle of planning and execution. Realtime search cannot guarantee to find an optimal solution, but can interleave planning and execution.This research focuses on extending realtime search algorithms for autonomous agents and for a multiagent world. Though realtime search provides an attractive framework for resource-bounded problem solving, the behavior of the problem solver is not rational enough for autonomous agents : the problem solver tends to perform superfluous actions before attaining the goal ; and the problem solver cannot utilize and improve previous experiments. Other problems are that though the algorithms interleave planning and execution, they cannot be directly applied to a multiagent world ; the problem solver cannot adapt to the dynamically changing goals ; and the problem solver cannot cooperatively solve problems with other problem solvers. We developed a series of new algorithms including Weighted Realtime Search, Realtime Search with Upper Bounds, Moving Target Search and Realtime Bidirectional Search to overcome the above problems.
现有的搜索算法可以分为两类:离线搜索,例如A1 <**>,以及实时搜索,例如实时-A1 <**>(RTA <**>)和学习实时-A1 <**>(LRTA <**>)。离线搜索在执行目标状态之前会完全检查每一条可能的路径,而实时搜索在恒定的时间内做出每个决策,并将其决策提交给物理世界。问题解决者通过重复计划和执行的循环最终达到目标。实时搜索不能保证找到一个最优解,但可以交错规划和execution.This研究的重点是扩展实时搜索算法的自治代理和多智能体的世界。尽管实时搜索为资源有限的问题解决提供了一个有吸引力的框架,但问题解决者的行为对于自治代理来说不够合理:问题解决者往往在实现目标之前执行多余的动作;并且问题解决者无法利用和改进之前的实验。其他的问题是,虽然算法交错规划和执行,他们不能直接应用到多智能体世界;问题解决者不能适应动态变化的目标;和问题解决者不能合作解决问题与其他问题解决者。为了克服上述问题,我们提出了一系列新的算法,包括加权实时搜索、上界实时搜索、移动目标搜索和实时双向搜索。

项目成果

期刊论文数量(23)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
石田亨: "エージェントを考える" 人工知能学会誌. Vol.10,No.5. 663-667 (1996)
Toru Ishida:“对代理的思考”,人工智能学会杂志,第 10 卷,第 663-667 期(1996 年)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Toru Ishida: "A Moving Target Search : A Real-Time Search for Changing Goals" IEEE Trans. on Pattern Analysis and Machine Intelligence. Vol. 17, No. 6. 609-619 (1995)
Toru Ishida:“移动目标搜索:实时搜索不断变化的目标”IEEE Trans。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Toru Ishida, Richard E. Korf: "Moving-Target Search : A Real-Time Search for Changing Goals" IEEE Transactions on Pattern Analysis and Machine Intelligence. 17. 609-619 (1995)
Toru Ishida、Richard E. Korf:“移动目标搜索:对不断变化的目标的实时搜索”IEEE 模式分析和机器智能汇刊。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
石田亨: "実時間探索による経路学習" 人工知能学会誌. Vol.11,No.2. 411-419 (1996)
Toru Ishida:“使用实时搜索进行路线学习”,人工智能学会杂志,第 11 卷,第 411-419 期(1996 年)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
T.Ishida: "Improving the Learning Efficiencies of Realtime Search" Proc.of the 13th International Conference on Artificial Intelligence (AAAI-96). 385-392 (1996)
T.Ishida:第 13 届国际人工智能会议 (AAAI-96) 的“提高实时搜索的学习效率”。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

ISHIDA Toru其他文献

Privacy-Aware Best-Balanced Multilingual Communication
注重隐私的最佳平衡多语言沟通

ISHIDA Toru的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('ISHIDA Toru', 18)}}的其他基金

Basic research of "Yakkan-shi (Joseon's diplomatic mission to Tsushima)" between Japan and Korea in the early modern period
近代初期日韩“药监使”的基础研究
  • 批准号:
    15K02837
  • 财政年份:
    2015
  • 资助金额:
    $ 4.86万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Mental health and parenting style in parents of adolescents with high-functioning pervasive developmental disorders
高功能广泛性发育障碍青少年家长的心理健康和教养方式
  • 批准号:
    25870199
  • 财政年份:
    2013
  • 资助金额:
    $ 4.86万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
Comparative Politics on Renationalization:The Dilemma of Democracy in Europe
重新民族化的比较政治:欧洲民主的困境
  • 批准号:
    24330049
  • 财政年份:
    2012
  • 资助金额:
    $ 4.86万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Research on Collective Intelligence Based on Services Computing
基于服务计算的集体智慧研究
  • 批准号:
    21240014
  • 财政年份:
    2009
  • 资助金额:
    $ 4.86万
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)
Research on participatory design using massively multi-agent systems
大规模多智能体系统的参与式设计研究
  • 批准号:
    18200009
  • 财政年份:
    2006
  • 资助金额:
    $ 4.86万
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)
Human-Centered Semantic Web
以人为中心的语义网
  • 批准号:
    15200012
  • 财政年份:
    2003
  • 资助金额:
    $ 4.86万
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)
Comparative institutional analysis of the Japanese type of welfare pluralism - the importance of social welfare reforms singe 1980s in Japan -
日本型福利多元化的制度比较分析——20世纪80年代以来日本社会福利改革的重要性——
  • 批准号:
    11620092
  • 财政年份:
    1999
  • 资助金额:
    $ 4.86万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Building Digital Cities as a Social Information Infrastructure
建设数字城市作为社会信息基础设施
  • 批准号:
    11792025
  • 财政年份:
    1999
  • 资助金额:
    $ 4.86万
  • 项目类别:
    Grant-in-Aid for University and Society Collaboration
Resource Allocation for Wide-Area Networks Based on Economic Models
基于经济模型的广域网资源分配
  • 批准号:
    10480071
  • 财政年份:
    1998
  • 资助金额:
    $ 4.86万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B).
Development of a Multiagent Platform on Hetrogeneous golbal Networks
异构全球网络多智能体平台的开发
  • 批准号:
    06558046
  • 财政年份:
    1994
  • 资助金额:
    $ 4.86万
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)

相似国自然基金

Scalable Learning and Optimization: High-dimensional Models and Online Decision-Making Strategies for Big Data Analysis
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    万元
  • 项目类别:
    合作创新研究团队
Understanding structural evolution of galaxies with machine learning
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
煤矿安全人机混合群智感知任务的约束动态多目标Q-learning进化分配
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于领弹失效考量的智能弹药编队短时在线Q-learning协同控制机理
  • 批准号:
    62003314
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
集成上下文张量分解的e-learning资源推荐方法研究
  • 批准号:
    61902016
  • 批准年份:
    2019
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
儿童音乐能力发展对语言与社会认知能力及脑发育的影响
  • 批准号:
    31971003
  • 批准年份:
    2019
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目
具有时序迁移能力的Spiking-Transfer learning (脉冲-迁移学习)方法研究
  • 批准号:
    61806040
  • 批准年份:
    2018
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
基于Deep-learning的三江源区冰川监测动态识别技术研究
  • 批准号:
    51769027
  • 批准年份:
    2017
  • 资助金额:
    38.0 万元
  • 项目类别:
    地区科学基金项目
多场景网络学习中基于行为-情感-主题联合建模的学习者兴趣挖掘关键技术研究
  • 批准号:
    61702207
  • 批准年份:
    2017
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目
基于异构医学影像数据的深度挖掘技术及中枢神经系统重大疾病的精准预测
  • 批准号:
    61672236
  • 批准年份:
    2016
  • 资助金额:
    64.0 万元
  • 项目类别:
    面上项目

相似海外基金

Collaborative Research: CDS&E: Generalizable RANS Turbulence Models through Scientific Multi-Agent Reinforcement Learning
合作研究:CDS
  • 批准号:
    2347423
  • 财政年份:
    2024
  • 资助金额:
    $ 4.86万
  • 项目类别:
    Standard Grant
CAREER: Strategic Interactions, Learning, and Dynamics in Large-Scale Multi-Agent Systems: Achieving Tractability via Graph Limits
职业:大规模多智能体系统中的战略交互、学习和动态:通过图限制实现可处理性
  • 批准号:
    2340289
  • 财政年份:
    2024
  • 资助金额:
    $ 4.86万
  • 项目类别:
    Continuing Grant
Optimizing Intelligent Vehicular Routing with Edge Computing through Multi-Agent Reinforcement Learning
通过多智能体强化学习利用边缘计算优化智能车辆路由
  • 批准号:
    24K14913
  • 财政年份:
    2024
  • 资助金额:
    $ 4.86万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Collaborative Research: CDS&E: Generalizable RANS Turbulence Models through Scientific Multi-Agent Reinforcement Learning
合作研究:CDS
  • 批准号:
    2347422
  • 财政年份:
    2024
  • 资助金额:
    $ 4.86万
  • 项目类别:
    Standard Grant
CAREER: Structure Exploiting Multi-Agent Reinforcement Learning for Large Scale Networked Systems: Locality and Beyond
职业:为大规模网络系统利用多智能体强化学习的结构:局部性及其他
  • 批准号:
    2339112
  • 财政年份:
    2024
  • 资助金额:
    $ 4.86万
  • 项目类别:
    Continuing Grant
AF: Small: Equilibrium Computation and Multi-Agent Learning in High-Dimensional Games
AF:小:高维游戏中的平衡计算和多智能体学习
  • 批准号:
    2342642
  • 财政年份:
    2024
  • 资助金额:
    $ 4.86万
  • 项目类别:
    Standard Grant
Learning Coordination for Multi-Autonomous Multi-Human (MAMH) Agent Systems with Guaranteed Safety
具有安全保证的多自主多人(MAMH)代理系统的学习协调
  • 批准号:
    2332210
  • 财政年份:
    2024
  • 资助金额:
    $ 4.86万
  • 项目类别:
    Standard Grant
CPS: Medium: Collaborative Research: Provably Safe and Robust Multi-Agent Reinforcement Learning with Applications in Urban Air Mobility
CPS:中:协作研究:可证明安全且鲁棒的多智能体强化学习及其在城市空中交通中的应用
  • 批准号:
    2312092
  • 财政年份:
    2023
  • 资助金额:
    $ 4.86万
  • 项目类别:
    Standard Grant
Development of multimode vacuum ionization for use in medical diagnostics
开发用于医疗诊断的多模式真空电离
  • 批准号:
    10697560
  • 财政年份:
    2023
  • 资助金额:
    $ 4.86万
  • 项目类别:
Characterizing Entorhinal Cortex Circuit Dysfunction in an APOE Mouse Model of Chemotherapy-Induced Cognitive Impairment
化疗引起认知障碍的 APOE 小鼠模型中内嗅皮层回路功能障碍的特征
  • 批准号:
    10677984
  • 财政年份:
    2023
  • 资助金额:
    $ 4.86万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了