Human-Scale Game Theory in Imperfect Information Settings

不完美信息环境下的人性博弈论

基本信息

  • 批准号:
    298239-2012
  • 负责人:
  • 金额:
    $ 3.06万
  • 依托单位:
  • 依托单位国家:
    加拿大
  • 项目类别:
    Discovery Grants Program - Individual
  • 财政年份:
    2016
  • 资助国家:
    加拿大
  • 起止时间:
    2016-01-01 至 2017-12-31
  • 项目状态:
    已结题

项目摘要

Decision making in the presence of other agents is a critical challenge for deploying artificially intelligent agents in real-world settings. Real world settings -- ranging from negotiation to security to interactive entertainment -- also typically involve imperfect information, where agents are missing key pieces of information to make their decisions. Game-theoretic techniques for decision-making under such circumstances have recently seen considerable improvement. However, they are still not adequate for human-scale problems. For example, advancements in general-purpose equilibrium algorithms for sequential games have made it possible to solve games with trillions of game states (up from millions only 5 years ago), yet the smallest variants of well known games played by humans (e.g., poker) are still far much larger. While my research group has had some recent success at playing complex games at a human level, the techniques employed necessarily give up theoretical guarantees when applied to such large domains. Without guarantees, though, it is hard to predict the success of the approaches for other applications, or guide a practitioner in how best to exploit improvements in computing resources.
在其他代理商在场的情况下,决策是在现实世界中部署人工智能代理的一个关键挑战。现实世界中的环境 - 从谈判到安全到交互式娱乐 - 通常还涉及不完美的信息,而代理缺少关键信息来做出决定。在这种情况下,用于决策的游戏理论技术最近已有很大的改进。但是,它们仍然不足以解决人类规模的问题。例如,连续游戏的通用均衡算法的进步使得以数万亿的游戏状态(仅在5年前就高于数百万人)可以解决游戏,但是人类(例如,扑克)玩过的最著名游戏的最小变体仍然大得多。尽管我的研究小组最近在人体层面上玩复杂的游戏方面取得了一些成功,但使用的技术在适用于如此大的领域时必须放弃理论保证。但是,没有保证,很难预测其他应用程序的成功,或者指导从业者如何最好地利用计算资源的改进。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Bowling, Michael其他文献

Heads-up limit hold'em poker is solved
  • DOI:
    10.1126/science.1259433
  • 发表时间:
    2015-01-09
  • 期刊:
  • 影响因子:
    56.9
  • 作者:
    Bowling, Michael;Burch, Neil;Tammelin, Oskari
  • 通讯作者:
    Tammelin, Oskari
DeepStack: Expert-level artificial intelligence in heads-up no-limit poker
  • DOI:
    10.1126/science.aam6960
  • 发表时间:
    2017-05-05
  • 期刊:
  • 影响因子:
    56.9
  • 作者:
    Moravcik, Matej;Schmid, Martin;Bowling, Michael
  • 通讯作者:
    Bowling, Michael
Machine learning and games
  • DOI:
    10.1007/s10994-006-8919-x
  • 发表时间:
    2006-06-01
  • 期刊:
  • 影响因子:
    7.5
  • 作者:
    Bowling, Michael;Fuernkranz, Johannes;Musick, Ron
  • 通讯作者:
    Musick, Ron
Student of Games: A unified learning algorithm for both perfect and imperfect information games.
  • DOI:
    10.1126/sciadv.adg3256
  • 发表时间:
    2023-11-17
  • 期刊:
  • 影响因子:
    13.6
  • 作者:
    Schmid, Martin;Moravcik, Matej;Burch, Neil;Kadlec, Rudolf;Davidson, Josh;Waugh, Kevin;Bard, Nolan;Timbers, Finbarr;Lanctot, Marc;Holland, G. Zacharias;Davoodi, Elnaz;Christianson, Alden;Bowling, Michael
  • 通讯作者:
    Bowling, Michael
The Hanabi challenge: A new frontier for AI research
  • DOI:
    10.1016/j.artint.2019.103216
  • 发表时间:
    2020-03-01
  • 期刊:
  • 影响因子:
    14.4
  • 作者:
    Bard, Nolan;Foerster, Jakob N.;Bowling, Michael
  • 通讯作者:
    Bowling, Michael

Bowling, Michael的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Bowling, Michael', 18)}}的其他基金

Human-Scale Decision Making in Uncertain Environments
不确定环境中的人性化决策
  • 批准号:
    RGPIN-2018-04268
  • 财政年份:
    2022
  • 资助金额:
    $ 3.06万
  • 项目类别:
    Discovery Grants Program - Individual
Human-Scale Decision Making in Uncertain Environments
不确定环境中的人性化决策
  • 批准号:
    RGPIN-2018-04268
  • 财政年份:
    2021
  • 资助金额:
    $ 3.06万
  • 项目类别:
    Discovery Grants Program - Individual
Human-Scale Decision Making in Uncertain Environments
不确定环境中的人性化决策
  • 批准号:
    RGPIN-2018-04268
  • 财政年份:
    2020
  • 资助金额:
    $ 3.06万
  • 项目类别:
    Discovery Grants Program - Individual
Human-Scale Decision Making in Uncertain Environments
不确定环境中的人性化决策
  • 批准号:
    RGPIN-2018-04268
  • 财政年份:
    2019
  • 资助金额:
    $ 3.06万
  • 项目类别:
    Discovery Grants Program - Individual
Human-Scale Decision Making in Uncertain Environments
不确定环境中的人性化决策
  • 批准号:
    RGPIN-2018-04268
  • 财政年份:
    2018
  • 资助金额:
    $ 3.06万
  • 项目类别:
    Discovery Grants Program - Individual
Human-Scale Game Theory in Imperfect Information Settings
不完美信息环境下的人性博弈论
  • 批准号:
    298239-2012
  • 财政年份:
    2015
  • 资助金额:
    $ 3.06万
  • 项目类别:
    Discovery Grants Program - Individual
Human-Scale Game Theory in Imperfect Information Settings
不完美信息环境下的人性博弈论
  • 批准号:
    298239-2012
  • 财政年份:
    2014
  • 资助金额:
    $ 3.06万
  • 项目类别:
    Discovery Grants Program - Individual
Human-Scale Game Theory in Imperfect Information Settings
不完美信息环境下的人性博弈论
  • 批准号:
    298239-2012
  • 财政年份:
    2013
  • 资助金额:
    $ 3.06万
  • 项目类别:
    Discovery Grants Program - Individual
Human-Scale Game Theory in Imperfect Information Settings
不完美信息环境下的人性博弈论
  • 批准号:
    298239-2012
  • 财政年份:
    2012
  • 资助金额:
    $ 3.06万
  • 项目类别:
    Discovery Grants Program - Individual
Data-driven statistical agent modelling
数据驱动的统计代理建模
  • 批准号:
    298239-2007
  • 财政年份:
    2011
  • 资助金额:
    $ 3.06万
  • 项目类别:
    Discovery Grants Program - Individual

相似国自然基金

基于基因组数据自动化分析为后生动物类群大规模开发扩增子捕获探针的实现
  • 批准号:
    32370477
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
基于容量驱动的大规模异构天线阵列关键技术研究
  • 批准号:
    62301460
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
面向大规模强化学习任务的预测控制理论与方法研究
  • 批准号:
    62376179
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目
基于黎曼流体空间的大规模知识图谱感知推荐关键技术研究
  • 批准号:
    62376135
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目
面向非对称收发机的大规模MIMO传输理论与方法研究
  • 批准号:
    62301221
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Unraveling neuronal circuits and causal underpinnings of long time-scale social strategic behaviors
揭示长期社会策略行为的神经元回路和因果基础
  • 批准号:
    10820072
  • 财政年份:
    2020
  • 资助金额:
    $ 3.06万
  • 项目类别:
Human-scale Game Solving through Estimation While Learning
通过边学习边估计来解决人类规模的游戏
  • 批准号:
    475487-2015
  • 财政年份:
    2017
  • 资助金额:
    $ 3.06万
  • 项目类别:
    Postgraduate Scholarships - Doctoral
Human-scale Game Solving through Estimation While Learning
通过边学习边估计来解决人类规模的游戏
  • 批准号:
    475487-2015
  • 财政年份:
    2016
  • 资助金额:
    $ 3.06万
  • 项目类别:
    Postgraduate Scholarships - Doctoral
Human-scale Game Solving through Estimation While Learning
通过边学习边估计来解决人类规模的游戏
  • 批准号:
    475487-2015
  • 财政年份:
    2015
  • 资助金额:
    $ 3.06万
  • 项目类别:
    Postgraduate Scholarships - Doctoral
Human-Scale Game Theory in Imperfect Information Settings
不完美信息环境下的人性博弈论
  • 批准号:
    298239-2012
  • 财政年份:
    2015
  • 资助金额:
    $ 3.06万
  • 项目类别:
    Discovery Grants Program - Individual
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了