Realtime Search for Learning Autonomous Agents
实时搜索学习自主代理
基本信息
- 批准号:06452402
- 负责人:
- 金额:$ 4.86万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research (B)
- 财政年份:1994
- 资助国家:日本
- 起止时间:1994 至 1996
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
Existing search algorithms can be divided into two classes : offline search such as A^<**>, and realtime search such as Real-Time-A^<**> (RTA^<**>) and Learning Real-Time-A^<**> (LRTA^<**>). Offline search completely examines every possible path to the goal state before executing that path, while realtime search makes each decision in a constant time, and commits its decision to the physical world. The problem solver eventually reaches the goal by repeating the cycle of planning and execution. Realtime search cannot guarantee to find an optimal solution, but can interleave planning and execution.This research focuses on extending realtime search algorithms for autonomous agents and for a multiagent world. Though realtime search provides an attractive framework for resource-bounded problem solving, the behavior of the problem solver is not rational enough for autonomous agents : the problem solver tends to perform superfluous actions before attaining the goal ; and the problem solver cannot utilize and improve previous experiments. Other problems are that though the algorithms interleave planning and execution, they cannot be directly applied to a multiagent world ; the problem solver cannot adapt to the dynamically changing goals ; and the problem solver cannot cooperatively solve problems with other problem solvers. We developed a series of new algorithms including Weighted Realtime Search, Realtime Search with Upper Bounds, Moving Target Search and Realtime Bidirectional Search to overcome the above problems.
现有的搜索算法可以分为两类:离线搜索(如A^<;**>;)和实时搜索(如Real-Time-A^<;**&>t;(RTA^<;**&>t;)和学习实时-A^<;**&>t;(LRTA^<;**>;)。离线搜索在执行该路径之前会完全检查通向目标状态的每条可能路径,而实时搜索在固定时间内做出每个决策,并将其决策提交给物理世界。问题解决者通过重复计划和执行的循环最终达到目标。实时搜索不能保证找到最优解,但可以交错规划和执行。本研究的重点是扩展自治代理和多代理世界的实时搜索算法。虽然实时搜索为资源受限的问题解决提供了一个有吸引力的框架,但问题求解器的行为对于自主代理来说是不够理性的:问题求解器往往在达到目标之前执行多余的动作;并且问题求解器无法利用和改进先前的实验。其他问题是,虽然算法交错计划和执行,但它们不能直接应用于多智能体世界;问题求解器不能适应动态变化的目标;问题求解器不能与其他问题求解器合作解决问题。针对上述问题,我们提出了加权实时搜索、带上界的实时搜索、移动目标搜索和实时双向搜索等一系列新算法。
项目成果
期刊论文数量(23)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Toru Ishida: "A Moving Target Search : A Real-Time Search for Changing Goals" IEEE Trans. on Pattern Analysis and Machine Intelligence. Vol. 17, No. 6. 609-619 (1995)
Toru Ishida:“移动目标搜索:实时搜索不断变化的目标”IEEE Trans。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
石田亨: "エージェントを考える" 人工知能学会誌. Vol.10,No.5. 663-667 (1996)
Toru Ishida:“对代理的思考”,人工智能学会杂志,第 10 卷,第 663-667 期(1996 年)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
Toru Ishida, Richard E. Korf: "Moving-Target Search : A Real-Time Search for Changing Goals" IEEE Transactions on Pattern Analysis and Machine Intelligence. 17. 609-619 (1995)
Toru Ishida、Richard E. Korf:“移动目标搜索:对不断变化的目标的实时搜索”IEEE 模式分析和机器智能汇刊。 
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
石田亨: "実時間探索による経路学習" 人工知能学会誌. Vol.11,No.2. 411-419 (1996)
Toru Ishida:“使用实时搜索进行路线学习”,人工智能学会杂志,第 11 卷,第 411-419 期(1996 年)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
T.Ishida: "Improving the Learning Efficiencies of Realtime Search" Proc.of the 13th International Conference on Artificial Intelligence (AAAI-96). 385-392 (1996)
T.Ishida:第 13 届国际人工智能会议 (AAAI-96) 的“提高实时搜索的学习效率”。 
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
                item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi }} 
- 发表时间:{{ item.publish_year }} 
- 期刊:
- 影响因子:{{ item.factor }}
- 作者:{{ item.authors }} 
- 通讯作者:{{ item.author }} 
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.author }} 
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.author }} 
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.author }} 
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.author }} 
数据更新时间:{{ patent.updateTime }}
ISHIDA Toru其他文献
Privacy-Aware Best-Balanced Multilingual Communication
注重隐私的最佳平衡多语言沟通
- DOI:10.1587/transinf.2019kbp0008 
- 发表时间:2020 
- 期刊:
- 影响因子:0.7
- 作者:PITUXCOOSUVARN Mondheera;NAKAGUCHI Takao;LIN Donghui;ISHIDA Toru 
- 通讯作者:ISHIDA Toru 
ISHIDA Toru的其他文献
{{
              item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi }} 
- 发表时间:{{ item.publish_year }} 
- 期刊:
- 影响因子:{{ item.factor }}
- 作者:{{ item.authors }} 
- 通讯作者:{{ item.author }} 
{{ truncateString('ISHIDA Toru', 18)}}的其他基金
Basic research of "Yakkan-shi (Joseon's diplomatic mission to Tsushima)" between Japan and Korea in the early modern period
近代初期日韩“药监使”的基础研究
- 批准号:15K02837 
- 财政年份:2015
- 资助金额:$ 4.86万 
- 项目类别:Grant-in-Aid for Scientific Research (C) 
Mental health and parenting style in parents of adolescents with high-functioning pervasive developmental disorders
高功能广泛性发育障碍青少年家长的心理健康和教养方式
- 批准号:25870199 
- 财政年份:2013
- 资助金额:$ 4.86万 
- 项目类别:Grant-in-Aid for Young Scientists (B) 
Comparative Politics on Renationalization:The Dilemma of Democracy in Europe
重新民族化的比较政治:欧洲民主的困境
- 批准号:24330049 
- 财政年份:2012
- 资助金额:$ 4.86万 
- 项目类别:Grant-in-Aid for Scientific Research (B) 
Research on Collective Intelligence Based on Services Computing
基于服务计算的集体智慧研究
- 批准号:21240014 
- 财政年份:2009
- 资助金额:$ 4.86万 
- 项目类别:Grant-in-Aid for Scientific Research (A) 
Research on participatory design using massively multi-agent systems
大规模多智能体系统的参与式设计研究
- 批准号:18200009 
- 财政年份:2006
- 资助金额:$ 4.86万 
- 项目类别:Grant-in-Aid for Scientific Research (A) 
Human-Centered Semantic Web
以人为中心的语义网
- 批准号:15200012 
- 财政年份:2003
- 资助金额:$ 4.86万 
- 项目类别:Grant-in-Aid for Scientific Research (A) 
Comparative institutional analysis of the Japanese type of welfare pluralism - the importance of social welfare reforms singe 1980s in Japan -
日本型福利多元化的制度比较分析——20世纪80年代以来日本社会福利改革的重要性——
- 批准号:11620092 
- 财政年份:1999
- 资助金额:$ 4.86万 
- 项目类别:Grant-in-Aid for Scientific Research (C) 
Building Digital Cities as a Social Information Infrastructure
建设数字城市作为社会信息基础设施
- 批准号:11792025 
- 财政年份:1999
- 资助金额:$ 4.86万 
- 项目类别:Grant-in-Aid for University and Society Collaboration 
Resource Allocation for Wide-Area Networks Based on Economic Models
基于经济模型的广域网资源分配
- 批准号:10480071 
- 财政年份:1998
- 资助金额:$ 4.86万 
- 项目类别:Grant-in-Aid for Scientific Research (B). 
Development of a Multiagent Platform on Hetrogeneous golbal Networks
异构全球网络多智能体平台的开发
- 批准号:06558046 
- 财政年份:1994
- 资助金额:$ 4.86万 
- 项目类别:Grant-in-Aid for Scientific Research (A) 
相似国自然基金
Scalable Learning and Optimization: High-dimensional Models and Online Decision-Making Strategies for Big Data Analysis
- 批准号:
- 批准年份:2024
- 资助金额:万元
- 项目类别:合作创新研究团队
Understanding structural evolution of galaxies with machine learning
- 批准号:
- 批准年份:2022
- 资助金额:10.0 万元
- 项目类别:省市级项目
煤矿安全人机混合群智感知任务的约束动态多目标Q-learning进化分配
- 批准号:
- 批准年份:2022
- 资助金额:30 万元
- 项目类别:青年科学基金项目
基于领弹失效考量的智能弹药编队短时在线Q-learning协同控制机理
- 批准号:62003314
- 批准年份:2020
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
集成上下文张量分解的e-learning资源推荐方法研究
- 批准号:61902016
- 批准年份:2019
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
儿童音乐能力发展对语言与社会认知能力及脑发育的影响
- 批准号:31971003
- 批准年份:2019
- 资助金额:58.0 万元
- 项目类别:面上项目
具有时序迁移能力的Spiking-Transfer learning (脉冲-迁移学习)方法研究
- 批准号:61806040
- 批准年份:2018
- 资助金额:20.0 万元
- 项目类别:青年科学基金项目
基于Deep-learning的三江源区冰川监测动态识别技术研究
- 批准号:51769027
- 批准年份:2017
- 资助金额:38.0 万元
- 项目类别:地区科学基金项目
多场景网络学习中基于行为-情感-主题联合建模的学习者兴趣挖掘关键技术研究
- 批准号:61702207
- 批准年份:2017
- 资助金额:21.0 万元
- 项目类别:青年科学基金项目
基于异构医学影像数据的深度挖掘技术及中枢神经系统重大疾病的精准预测
- 批准号:61672236
- 批准年份:2016
- 资助金额:64.0 万元
- 项目类别:面上项目
相似海外基金
Collaborative Research: CDS&E: Generalizable RANS Turbulence Models through Scientific Multi-Agent Reinforcement Learning
合作研究:CDS
- 批准号:2347423 
- 财政年份:2024
- 资助金额:$ 4.86万 
- 项目类别:Standard Grant 
Optimizing Intelligent Vehicular Routing with Edge Computing through Multi-Agent Reinforcement Learning
通过多智能体强化学习利用边缘计算优化智能车辆路由
- 批准号:24K14913 
- 财政年份:2024
- 资助金额:$ 4.86万 
- 项目类别:Grant-in-Aid for Scientific Research (C) 
CAREER: Strategic Interactions, Learning, and Dynamics in Large-Scale Multi-Agent Systems: Achieving Tractability via Graph Limits
职业:大规模多智能体系统中的战略交互、学习和动态:通过图限制实现可处理性
- 批准号:2340289 
- 财政年份:2024
- 资助金额:$ 4.86万 
- 项目类别:Continuing Grant 
Collaborative Research: CDS&E: Generalizable RANS Turbulence Models through Scientific Multi-Agent Reinforcement Learning
合作研究:CDS
- 批准号:2347422 
- 财政年份:2024
- 资助金额:$ 4.86万 
- 项目类别:Standard Grant 
CAREER: Structure Exploiting Multi-Agent Reinforcement Learning for Large Scale Networked Systems: Locality and Beyond
职业:为大规模网络系统利用多智能体强化学习的结构:局部性及其他
- 批准号:2339112 
- 财政年份:2024
- 资助金额:$ 4.86万 
- 项目类别:Continuing Grant 
AF: Small: Equilibrium Computation and Multi-Agent Learning in High-Dimensional Games
AF:小:高维游戏中的平衡计算和多智能体学习
- 批准号:2342642 
- 财政年份:2024
- 资助金额:$ 4.86万 
- 项目类别:Standard Grant 
Learning Coordination for Multi-Autonomous Multi-Human (MAMH) Agent Systems with Guaranteed Safety
具有安全保证的多自主多人(MAMH)代理系统的学习协调
- 批准号:2332210 
- 财政年份:2024
- 资助金额:$ 4.86万 
- 项目类别:Standard Grant 
CPS: Medium: Collaborative Research: Provably Safe and Robust Multi-Agent Reinforcement Learning with Applications in Urban Air Mobility
CPS:中:协作研究:可证明安全且鲁棒的多智能体强化学习及其在城市空中交通中的应用
- 批准号:2312092 
- 财政年份:2023
- 资助金额:$ 4.86万 
- 项目类别:Standard Grant 
A Multi-Institute Survivorship Study of Patients Living with Advanced Cancer Who Have Had Durable Response to Immune Checkpoint Inhibitors
对免疫检查点抑制剂有持久反应的晚期癌症患者的多机构生存研究
- 批准号:10714336 
- 财政年份:2023
- 资助金额:$ 4.86万 
- 项目类别:
ETS1-dependent combinatorial control of oncogenic transcription in Notch-activated T-ALL
Notch激活的T-ALL中致癌转录的ETS1依赖性组合控制
- 批准号:10733945 
- 财政年份:2023
- 资助金额:$ 4.86万 
- 项目类别:

 刷新
              刷新
            
















 {{item.name}}会员
              {{item.name}}会员
            



