RI: Small: Understanding Value-based Multiagent Learning and Its Applications
RI:小:了解基于价值的多智能体学习及其应用
基本信息
- 批准号:1018152
- 负责人:
- 金额:$ 45万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2010
- 资助国家:美国
- 起止时间:2010-08-15 至 2014-03-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
This project explores the behavior of value-based learning methods in multi-agent environments. Value-based methods make decisions by using experience to estimate the utility impact of alternatives and choosing those with high predicted value. Because they evaluate components of behavior instead of treating behaviors as atomic units, they are computationally and statistically efficient. While these methods have been used in computational experiments for many years, only recently have researchers begun to formally characterize their behavior. Our own preliminary work is finding that some value-based methods exhibit super-Nash behavior, making them particularly worthy of study.More specifically, we are analyzing, mathematically and experimentally, how value-based algorithms perform in several classes of simulated games of varying complexity from the artificial intelligence community, multi-agent engineering applications drawn from the wireless networking area, and as models of human and animal decision making in collaboration with cognitive neuroscientists. Where possible, we are refining existing value-based algorithms to work more efficiently, robustly, and generally than existing algorithms. We are also designing educational outreach activities, including creating entertaining instructional videos on how to promote cooperative behavior in real-life social dilemmas.
这个项目探讨了多智能体环境中基于价值的学习方法的行为。基于价值的方法通过使用经验来估计备选方案的效用影响并选择具有高预测价值的方案来做出决策。因为它们评估行为的组成部分,而不是将行为视为原子单元,所以它们在计算和统计上都是有效的。虽然这些方法已经在计算实验中使用了很多年,但直到最近研究人员才开始正式描述它们的行为。我们自己的初步工作是发现,一些基于价值的方法表现出超级纳什行为,使他们特别值得研究。更具体地说,我们正在分析,数学和实验,如何基于价值的算法在几类不同复杂性的模拟游戏从人工智能社区,多智能体工程应用程序从无线网络领域绘制,并与认知神经科学家合作,作为人类和动物决策的模型。在可能的情况下,我们正在改进现有的基于值的算法,使其比现有算法更有效,更强大,更通用。我们还在设计教育推广活动,包括制作关于如何在现实生活中的社会困境中促进合作行为的娱乐性教学视频。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
                item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi }} 
- 发表时间:{{ item.publish_year }} 
- 期刊:
- 影响因子:{{ item.factor }}
- 作者:{{ item.authors }} 
- 通讯作者:{{ item.author }} 
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.author }} 
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.author }} 
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.author }} 
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.author }} 
数据更新时间:{{ patent.updateTime }}
Michael Littman其他文献
Model-based reasoning
基于模型的推理
- DOI:10.1016/j.compedu.2012.11.014 
- 发表时间:2013 
- 期刊:
- 影响因子:0
- 作者:Michael Jackson;Janusz Wojtusiak;Dayne Freitag;Eugene Subbotsky;Hans M. Nordahl;Jens C. Thimm;John Burgoyne;Roberto Poli;Thomas R. Guskey;Michael Davison;J. Magnotti;Adam M. Goodman;Jeffrey S. Katz;L. Verschaffel;W. Dooren;B. Smedt;Sean A. Fulop;Melva R. Grant;Leonid I. Perlovsky;B. De Smedt;P. Ghesquière;Dariusz Plewczynski;Leily Ziglari;P. Birjandi;Scott Rick;Roberto Weber;N. Seel;Maike Luhmann;Michael Eid;A. Antonietti;Barbara Colombo;Hamish Coates;Ali Radloff;P. Pirnay;Dirk Ifenthaler;Edward Swing;Craig A Anderson;David Tzuriel;Norman M. Weinberger;David C. Riccio;Patrick K. Cullen;J. Tallet;Megan L. Hoffman;David A. Washburn;Iván Izquierdo;Jorge H. Medina;M. Cammarota;A. Podolskiy;Joke Torbeyns;J. Kranzler;P. A. Kirschner;F. Kirschner;Kenn Apel;Julie A. Wolter;J. Masterson;JungMi Lee;Stefan N Groesser;Sabine Al;Philip Barker;Paul Schaik;I. Cutica;Monica Bucciarelli;K. Pata;Anna Strasser;A. Guillot;N. Hoyek;Christian Collet;Maria Opfermann;Roger Azevedo;Detlev Leutner;Thomas C. Toppino;Alice Y. Kolb;David A. Kolb;P. Brazdil;Ricardo Vilalta;Carlos Soares;C. Giraud;Jeffrey W. Bloom;Tyler Volk;Marwan A. Dwairy;Richard A. Swanson;Johanna Pöysä;K. Luwel;Theo Hug;Angélique Martin;Nicolas Guéguen;Craig Hassed;Fabio Alivernini;Michael Herczeg;M. Mastropieri;T. Scruggs;Angelika Rieder;S. Castillo;Gerardo Ayala;R. Low;R. Babuška;Barbara C. Buckley;Henry Markovits;Sungho Kim;In;Michael J. Spector;A. Towse;Charlie N. Lewis;Brian Francis;David N. Rapp;Pratim Sengupta;Sidney D’Mello;Serge Brand;J. Patry;Cees Klaassen;Sieglinde Weyringer;Alfred Weinberger;Marilla D. Svinicki;Jane S. Vogler;Andrew J. Martin;John M. Keller;ChanMin Kim;Gabriele Wulf;Lynne E. Parker;Michael Wunder;Michael Littman;Lisa J. Lehmberg;C. Victor Fung;Hannele Niemi;Steven Reiss;Piet Desmet;F. Cornillie;Helmut M. Niegemann;Steffi Heidig;Dominic W. Massaro;Charles Fadel;Cheryl Lemke;R. Grabner;Michael D. Basil;Daniel R. Little;Stephan Lewandowsky;Parmjit Singh;Zheng Liu;Marcelo H. Ang;W. Seah;Jack Heller;C. Randles;Kenneth S. Aigen 
- 通讯作者:Kenneth S. Aigen 
Computably Continuous Reinforcement-Learning Objectives are PAC-learnable
可计算连续强化学习目标是 PAC 可学习的
- DOI:
- 发表时间:2023 
- 期刊:
- 影响因子:0
- 作者:Cambridge Yang;Michael Littman;Michael Carbin 
- 通讯作者:Michael Carbin 
Michael Littman的其他文献
{{
              item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi }} 
- 发表时间:{{ item.publish_year }} 
- 期刊:
- 影响因子:{{ item.factor }}
- 作者:{{ item.authors }} 
- 通讯作者:{{ item.author }} 
{{ truncateString('Michael Littman', 18)}}的其他基金
EAGER: Training A Mobile Robot from Human Feedback via Income Learning
EAGER:通过收入学习根据人类反馈训练移动机器人
- 批准号:1643413 
- 财政年份:2016
- 资助金额:$ 45万 
- 项目类别:Standard Grant 
Collaborative Research: American Innovations in an Age of Discovery: Teaching Science and Engineering through 3D-printed Historical Reconstructions
合作研究:发现时代的美国创新:通过 3D 打印历史重建教授科学与工程
- 批准号:1508319 
- 财政年份:2015
- 资助金额:$ 45万 
- 项目类别:Continuing Grant 
RI: Medium: Collaborative Research: Teaching Computers to Follow Verbal Instructions
RI:媒介:协作研究:教计算机遵循口头指令
- 批准号:1414931 
- 财政年份:2013
- 资助金额:$ 45万 
- 项目类别:Standard Grant 
RI: Small: Understanding Value-based Multiagent Learning and Its Applications
RI:小:了解基于价值的多智能体学习及其应用
- 批准号:1414935 
- 财政年份:2013
- 资助金额:$ 45万 
- 项目类别:Standard Grant 
RI: Small: Collaborative Research: Speeding Up Learning through Modeling the Pragmatics of Training
RI:小型:协作研究:通过培训语用建模加速学习
- 批准号:1319618 
- 财政年份:2013
- 资助金额:$ 45万 
- 项目类别:Continuing Grant 
RI: Medium: Collaborative Research: Teaching Computers to Follow Verbal Instructions
RI:媒介:协作研究:教计算机遵循口头指令
- 批准号:1065195 
- 财政年份:2011
- 资助金额:$ 45万 
- 项目类别:Standard Grant 
Collaborative Research: Pilot Research on Language-Based Strategies for Creative Problem Solving
协作研究:基于语言的创造性问题解决策略的试点研究
- 批准号:0757490 
- 财政年份:2008
- 资助金额:$ 45万 
- 项目类别:Standard Grant 
RI: Collaborative Research: Feature Discovery and Benchmarks for Exportable Reinforcement Learning
RI:协作研究:可导出强化学习的特征发现和基准
- 批准号:0713148 
- 财政年份:2007
- 资助金额:$ 45万 
- 项目类别:Standard Grant 
HSD-DRU: The Role of Communication in the Dynamics of Effective Decision Making
HSD-DRU:沟通在有效决策动态中的作用
- 批准号:0624191 
- 财政年份:2007
- 资助金额:$ 45万 
- 项目类别:Standard Grant 
Evaluating Next Generation Probabilistic Planners
评估下一代概率规划器
- 批准号:0329153 
- 财政年份:2003
- 资助金额:$ 45万 
- 项目类别:Continuing Grant 
相似国自然基金
昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
- 批准号:
- 批准年份:2024
- 资助金额:0.0 万元
- 项目类别:省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
- 批准号:n/a
- 批准年份:2022
- 资助金额:10.0 万元
- 项目类别:省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
- 批准号:32000033
- 批准年份:2020
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
- 批准号:31972324
- 批准年份:2019
- 资助金额:58.0 万元
- 项目类别:面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
- 批准号:81900988
- 批准年份:2019
- 资助金额:21.0 万元
- 项目类别:青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
- 批准号:31870821
- 批准年份:2018
- 资助金额:56.0 万元
- 项目类别:面上项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
- 批准号:31802058
- 批准年份:2018
- 资助金额:26.0 万元
- 项目类别:青年科学基金项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
- 批准号:31772128
- 批准年份:2017
- 资助金额:60.0 万元
- 项目类别:面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
- 批准号:81704176
- 批准年份:2017
- 资助金额:20.0 万元
- 项目类别:青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
- 批准号:91640114
- 批准年份:2016
- 资助金额:85.0 万元
- 项目类别:重大研究计划
相似海外基金
RI: Small: Understanding Hand Interaction In The Jumble of Internet Videos
RI:小:在混乱的互联网视频中理解手部交互
- 批准号:2426592 
- 财政年份:2024
- 资助金额:$ 45万 
- 项目类别:Standard Grant 
Collaborative Research: RI: Small: Motion Fields Understanding for Enhanced Long-Range Imaging
合作研究:RI:小型:增强远程成像的运动场理解
- 批准号:2232298 
- 财政年份:2023
- 资助金额:$ 45万 
- 项目类别:Standard Grant 
Collaborative Research: RI: Small: Motion Fields Understanding for Enhanced Long-Range Imaging
合作研究:RI:小型:增强远程成像的运动场理解
- 批准号:2232300 
- 财政年份:2023
- 资助金额:$ 45万 
- 项目类别:Standard Grant 
Collaborative Research: RI: Small: Motion Fields Understanding for Enhanced Long-Range Imaging
合作研究:RI:小型:增强远程成像的运动场理解
- 批准号:2232299 
- 财政年份:2023
- 资助金额:$ 45万 
- 项目类别:Standard Grant 
RI: Small: Toward Efficient and Robust Dynamic Scene Understanding Based on Visual Correspondences
RI:小:基于视觉对应的高效、鲁棒的动态场景理解
- 批准号:2310254 
- 财政年份:2023
- 资助金额:$ 45万 
- 项目类别:Standard Grant 
RI: Small: Understanding the Inductive Bias Caused by Invariance and Multi Scale in Neural Networks
RI:小:理解神经网络中不变性和多尺度引起的归纳偏差
- 批准号:2213335 
- 财政年份:2022
- 资助金额:$ 45万 
- 项目类别:Standard Grant 
RI: Small: Visual How: Task Understanding and Description in the Real World
RI:小:视觉方式:现实世界中的任务理解和描述
- 批准号:2143197 
- 财政年份:2022
- 资助金额:$ 45万 
- 项目类别:Standard Grant 
NSF-BSF: Collaborative Research: RI: Small: Multilingual Language Generation via Understanding of Code Switching
NSF-BSF:协作研究:RI:小型:通过理解代码切换生成多语言
- 批准号:2203097 
- 财政年份:2021
- 资助金额:$ 45万 
- 项目类别:Standard Grant 
RI: Small: Understanding and Synthesizing People in 3D Scenes
RI:小:理解和合成 3D 场景中的人物
- 批准号:2008313 
- 财政年份:2020
- 资助金额:$ 45万 
- 项目类别:Standard Grant 
NSF-BSF: Collaborative Research: RI: Small: Multilingual Language Generation via Understanding of Code Switching
NSF-BSF:协作研究:RI:小型:通过理解代码切换生成多语言
- 批准号:2007656 
- 财政年份:2020
- 资助金额:$ 45万 
- 项目类别:Standard Grant 

 刷新
              刷新
            
















 {{item.name}}会员
              {{item.name}}会员
            



