CAREER: Learning Agents in Dynamic, Collaborative, and Adversarial Multiagent Environments
职业:动态、协作和对抗性多智能体环境中的学习智能体
基本信息
- 批准号:0237699
- 负责人:
- 金额:$ 51.74万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Continuing Grant
- 财政年份:2003
- 资助国家:美国
- 起止时间:2003-02-01 至 2009-01-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
This project aims to enable multiple intelligent agents to learn to act both individually and in coordination with one another towards individual and/or common goals in real-time, noisy, collaborative and adversarial environments. The approach taken will be to study complete agents in specific, complex environments, with the goal of drawing general lessons from the specific implementations. Fundamental research will be conducted in four main areas. First, multiagent reinforcement learning will be scaled up to handle larger and more complex problems than has been previously possible. Second, new state representations suitable for learning will be proposed andtested. Third, game theoretic approaches to improving agent performance by predicting the responses of other agents will be investigated. Fourth, strategies for learning autonomous biddingagents will be developed and tested. Application domains will include: robotic soccer, both in simulation and with real robots; and autonomous bidding agents in multiple realistic scenarios.The rich simulation environments to be used for this research are ideal substrates for teaching students about complete intelligent agents, including perception, cognition, and action. The educational goals of this project include leveraging the appeal of these domains to students into challenging, exciting, and instructive undergraduate and graduate courses.
该项目旨在使多个智能代理能够学习在实时,嘈杂,协作和对抗环境中单独和相互协调地对个人和/或共同目标采取行动。 所采取的方法将是在特定的复杂环境中研究完整的代理,目的是从具体的实现中吸取一般的经验教训。基础研究将在四个主要领域进行。 首先,多智能体强化学习将扩大规模,以处理比以前更大、更复杂的问题。 第二,新的状态表示适合学习将提出和测试。 第三,将研究通过预测其他代理的响应来提高代理性能的博弈论方法。 第四,学习自主biddingagents的策略将被开发和测试。 应用领域将包括:机器人足球,无论是在模拟和与真实的机器人;和自主投标代理在多个现实scenaries.The丰富的模拟环境,用于这项研究是理想的基板,教学生完整的智能代理,包括感知,认知和行动。 该项目的教育目标包括利用这些领域对学生的吸引力,使其成为具有挑战性,令人兴奋和指导性的本科生和研究生课程。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Peter Stone其他文献
Composing Efficient, Robust Tests for Policy Selection
为策略选择编写高效、稳健的测试
- DOI:
10.48550/arxiv.2306.07372 - 发表时间:
2023 - 期刊:
- 影响因子:0
- 作者:
Dustin Morrill;Thomas J. Walsh;D. Hernández;Peter R. Wurman;Peter Stone - 通讯作者:
Peter Stone
Is yoghurt an acceptable alternative to raw milk for reducing eczema and allergy in infancy?
酸奶是否是生奶的可接受替代品,可以减少婴儿期的湿疹和过敏?
- DOI:
10.1111/cea.13121 - 发表时间:
2018 - 期刊:
- 影响因子:6.1
- 作者:
Julian Crane;C. Barthow;Edwin A. Mitchell;T. Stanley;Gordon Purdie;Judy Rowden;Janice Kang;Fiona Hood;Phillipa Barnes;P. Fitzharris;Robyn Maude;Peter Stone;Rinki Murphy;K. Wickens - 通讯作者:
K. Wickens
Wait, That Feels Familiar: Learning to Extrapolate Human Preferences for Preference Aligned Path Planning
等等,这感觉很熟悉:学习推断人类偏好以进行偏好一致的路径规划
- DOI:
- 发表时间:
2023 - 期刊:
- 影响因子:0
- 作者:
Haresh Karnan;Elvin Yang;Garrett Warnell;Joydeep Biswas;Peter Stone - 通讯作者:
Peter Stone
Improving artificial intelligence with games
通过游戏提高人工智能
- DOI:
- 发表时间:
2023 - 期刊:
- 影响因子:56.9
- 作者:
Peter R. Wurman;Peter Stone;Michael Spranger - 通讯作者:
Michael Spranger
Trophoblast debris contributes to the physiological maternal vascular adaptation to pregnancy by regulating endothelial cell proliferation
- DOI:
10.1016/j.placenta.2014.06.111 - 发表时间:
2014-09-01 - 期刊:
- 影响因子:
- 作者:
Jia Wei;Qi Chen;Jo James;Peter Stone;Larry Chamley - 通讯作者:
Larry Chamley
Peter Stone的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Peter Stone', 18)}}的其他基金
EAGER: Human-Aware Navigation in Populated Indoor Environments
EAGER:人口稠密的室内环境中的人类感知导航
- 批准号:
1651089 - 财政年份:2016
- 资助金额:
$ 51.74万 - 项目类别:
Standard Grant
II-NEW: Infrastructure for a Building-Wide Intelligence
II-新:建筑范围内的智能基础设施
- 批准号:
1305287 - 财政年份:2013
- 资助金额:
$ 51.74万 - 项目类别:
Standard Grant
CPS: Breakthrough: Reinforcement Learning Algorithms for Cyber-Physical Systems
CPS:突破:网络物理系统的强化学习算法
- 批准号:
1330072 - 财政年份:2013
- 资助金额:
$ 51.74万 - 项目类别:
Standard Grant
RI: Small: Efficient Reinforcement Learning for Generic Large-Scale Tasks
RI:小型:针对通用大规模任务的高效强化学习
- 批准号:
0917122 - 财政年份:2009
- 资助金额:
$ 51.74万 - 项目类别:
Standard Grant
Collaborative Research: Modeling the Role of Obliquity and Insolation Gradients in Controlling Global Ice Volume
合作研究:模拟倾角和日照梯度在控制全球冰量中的作用
- 批准号:
0221288 - 财政年份:2002
- 资助金额:
$ 51.74万 - 项目类别:
Standard Grant
Methods of Uncertainty Analysis of Complex Non-Linear Components in Integrated Systems Models
集成系统模型中复杂非线性分量的不确定性分析方法
- 批准号:
9909139 - 财政年份:2000
- 资助金额:
$ 51.74万 - 项目类别:
Standard Grant
Dynamics of Large-Scale Atmospheric and Oceanic Motions
大尺度大气和海洋运动动力学
- 批准号:
8115712 - 财政年份:1982
- 资助金额:
$ 51.74万 - 项目类别:
Standard Grant
相似国自然基金
Scalable Learning and Optimization: High-dimensional Models and Online Decision-Making Strategies for Big Data Analysis
- 批准号:
- 批准年份:2024
- 资助金额:万元
- 项目类别:合作创新研究团队
Understanding structural evolution of galaxies with machine learning
- 批准号:n/a
- 批准年份:2022
- 资助金额:10.0 万元
- 项目类别:省市级项目
煤矿安全人机混合群智感知任务的约束动态多目标Q-learning进化分配
- 批准号:
- 批准年份:2022
- 资助金额:30 万元
- 项目类别:青年科学基金项目
基于领弹失效考量的智能弹药编队短时在线Q-learning协同控制机理
- 批准号:62003314
- 批准年份:2020
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
集成上下文张量分解的e-learning资源推荐方法研究
- 批准号:61902016
- 批准年份:2019
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
具有时序迁移能力的Spiking-Transfer learning (脉冲-迁移学习)方法研究
- 批准号:61806040
- 批准年份:2018
- 资助金额:20.0 万元
- 项目类别:青年科学基金项目
基于Deep-learning的三江源区冰川监测动态识别技术研究
- 批准号:51769027
- 批准年份:2017
- 资助金额:38.0 万元
- 项目类别:地区科学基金项目
具有时序处理能力的Spiking-Deep Learning(脉冲深度学习)方法研究
- 批准号:61573081
- 批准年份:2015
- 资助金额:64.0 万元
- 项目类别:面上项目
基于有向超图的大型个性化e-learning学习过程模型的自动生成与优化
- 批准号:61572533
- 批准年份:2015
- 资助金额:66.0 万元
- 项目类别:面上项目
E-Learning中学习者情感补偿方法的研究
- 批准号:61402392
- 批准年份:2014
- 资助金额:26.0 万元
- 项目类别:青年科学基金项目
相似海外基金
CAREER: Stochasticity and Resilience in Reinforcement Learning: From Single to Multiple Agents
职业:强化学习中的随机性和弹性:从单个智能体到多个智能体
- 批准号:
2339794 - 财政年份:2024
- 资助金额:
$ 51.74万 - 项目类别:
Continuing Grant
Development of Cognitive Symbiosis in Virtual Agents to Improve Remote Classroom Learning Outcomes
虚拟代理认知共生的发展以改善远程课堂学习成果
- 批准号:
23K21688 - 财政年份:2024
- 资助金额:
$ 51.74万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
Agents of Change: Investigating How Partnerships between Faculty and Learning Assistants Enable Pathways for Sustainable Institutional and Classroom Transformation
变革的推动者:调查教师和学习助理之间的合作如何为可持续的机构和课堂转型提供途径
- 批准号:
2234074 - 财政年份:2023
- 资助金额:
$ 51.74万 - 项目类别:
Continuing Grant
Agents of Change: Investigating How Partnerships between Faculty and Learning Assistants Enable Pathways for Sustainable Institutional and Classroom Transformation
变革的推动者:调查教师和学习助理之间的合作如何为可持续的机构和课堂转型提供途径
- 批准号:
2234071 - 财政年份:2023
- 资助金额:
$ 51.74万 - 项目类别:
Continuing Grant
"Common Sense" and flexible learning in AI agents: Do current AI agents possess the "basic skills" necessary for them to enter the workforce?
AI智能体的“常识”和灵活学习:当前的AI智能体是否具备进入劳动力市场所需的“基本技能”?
- 批准号:
2884814 - 财政年份:2023
- 资助金额:
$ 51.74万 - 项目类别:
Studentship
Agents of Change: Investigating How Partnerships between Faculty and Learning Assistants Enable Pathways for Sustainable Institutional and Classroom Transformation
变革的推动者:调查教师和学习助理之间的合作如何为可持续的机构和课堂转型提供途径
- 批准号:
2234073 - 财政年份:2023
- 资助金额:
$ 51.74万 - 项目类别:
Continuing Grant
Developing inquisitive, model-based agents for reinforcement learning
开发好奇的、基于模型的强化学习代理
- 批准号:
RGPIN-2019-06079 - 财政年份:2022
- 资助金额:
$ 51.74万 - 项目类别:
Discovery Grants Program - Individual
Fast and Furious(ly) Safe: Predicting Intent of Agents on the Road Using Probabilistic Programming and Reinforcement Learning
《速度与激情》安全:使用概率编程和强化学习预测道路上智能体的意图
- 批准号:
559891-2021 - 财政年份:2022
- 资助金额:
$ 51.74万 - 项目类别:
Alexander Graham Bell Canada Graduate Scholarships - Doctoral
Learning health systems: fostering participatory learning and action to equip rural health workers as change agents for maternal and newborn care.
学习卫生系统:促进参与式学习和行动,使农村卫生工作者成为孕产妇和新生儿护理的变革推动者。
- 批准号:
MR/V020951/1 - 财政年份:2022
- 资助金额:
$ 51.74万 - 项目类别:
Research Grant
Modular and Lifelong Learning for Developing General Purpose Robotic Agents
用于开发通用机器人代理的模块化和终身学习
- 批准号:
RGPIN-2022-04331 - 财政年份:2022
- 资助金额:
$ 51.74万 - 项目类别:
Discovery Grants Program - Individual