RI: Small: Computational Techniques for Large Multi-Step Incomplete-Information Games
RI:小型:大型多步不完全信息博弈的计算技术
基本信息
- 批准号:1617590
- 负责人:
- 金额:$ 45万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2016
- 资助国家:美国
- 起止时间:2016-07-01 至 2019-06-30
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
Game-theoretic solution concepts provide a sound definition of how rational agents should act and update their beliefs in multiagent settings. The ability to compute such solutions in large incomplete-information games is a key capability in a myriad of applications, such as in negotiations, cybersecurity, physical security, medicine, and auctions. To achieve such strategically robust intelligence, the solution concepts must be accompanied by computational techniques for finding such solutions. Only then will the definitions be truly operational. The PI proposes a host of techniques for this. The proposed work will enable game theory to be an operational tool for analyzing large-scale settings. The methodology is application independent, so it has extremely broad applicability. To ensure scalability, the techniques will be benchmarked on very-large-scale games. This is on a path to a vision where software agents conduct commerce on behalf of humans and companies, or advise them. That leads to increased social welfare (or increase in other measures of desirability of outcomes) through better decision making. It also enables broader and fairer access because it helps put less experienced/educated people/companies on an equal footing with expert market participants. Broader access, in turn, increases the benefits of (electronic) commerce further, and the benefits get distributed more fairly across segments of society. The proposed algorithms can also help others in their research by 1) providing counter-examples to incorrect hypotheses (by rapidly generating and solving games within the class of interest, and observing properties of the equilibria) and 2) helping guide the formulation of new theorems by solving numerous cases.The proposed research has four high-level technical prongs: (1) The PI will leverage his recent breakthrough (with S. Singh) that enables game abstraction algorithms (which have to be lossy in order to create small enough models to solve) to create strategies that have bounds on exploitability. He proposes to broaden the framework to general sequential games, to develop better action and state abstraction algorithms, and to study abstraction both for scalability and modeling purposes. He also proposes algorithms that create imperfect-recall abstractions that have bounds, are potential-aware, support efficient distributed equilibrium finding, and have compact representations. In addition, he proposes techniques for optimal action abstraction and ways to do abstraction during equilibrium finding and during execution of the game strategy. (2) He proposes directions around the question of how opponents' actions should be mapped to the abstract model. He also plans to determine why making one's strategy less randomized can---surprisingly---be beneficial. (3) He proposes parallelization and sampling techniques for the counterfactual regret equilibrium-finding algorithm, and ways to solve imperfect-recall game abstractions. He also proposes techniques for effective, detailed endgame and midgame solving, as well as techniques that leverage endgame solving in finding an equilibrium for the entire game. He also proposes a new computationally feasible equilibrium refinement. (4) He proposes major scalability enhancements to algorithms that combine game-theoretic reasoning and opponent modeling. He proposes new directions based on a recent breakthrough (with S. Ganzfried) that shows that fully safe opponent exploitation is possible. He also proposes to study the three-way tradeoff among exploitation, exploitability, and exploration.
博弈论的解决方案的概念提供了一个合理的定义,理性的代理应该如何行动,并更新他们的信念在多智能体设置。在大型不完全信息博弈中计算此类解决方案的能力是谈判、网络安全、物理安全、医疗和拍卖等众多应用中的关键能力。为了实现这种战略上强大的智能,解决方案的概念必须伴随着计算技术,以找到这样的解决方案。 只有这样,这些定义才能真正具有可操作性。PI为此提出了一系列技术。拟议的工作将使博弈论成为一个操作工具,用于分析大规模的设置。该方法与应用无关,因此具有非常广泛的适用性。为了确保可扩展性,这些技术将在超大规模游戏上进行基准测试。这是一条通往软件代理代表人类和公司进行商业活动或为他们提供建议的愿景的道路。这导致通过更好的决策来增加社会福利(或增加其他衡量结果可取性的措施)。它还使更广泛和更公平的准入成为可能,因为它有助于将经验较少/受教育程度较低的人/公司与专家市场参与者置于平等的地位。更广泛的接触反过来又进一步增加了(电子)商务的好处,而且好处在社会各阶层之间得到更公平的分配。所提出的算法还可以通过以下方式帮助其他人进行研究:1)为不正确的假设提供反例(通过快速生成和解决感兴趣的类内的游戏,并观察均衡的属性); 2)通过解决大量案例来帮助指导新定理的制定。所提出的研究有四个高级别的技术分支:(1)PI将利用他最近的突破(与S. Singh),它使游戏抽象算法(为了创建足够小的模型来求解,这些算法必须是有损的)能够创建具有可利用性界限的策略。 他建议将框架扩展到一般的序列游戏,开发更好的动作和状态抽象算法,并研究抽象的可扩展性和建模目的。 他还提出了一些算法,这些算法可以创建具有边界的不可回忆抽象,具有潜在意识,支持高效的分布式均衡发现,并具有紧凑的表示。 此外,他还提出了最佳行动抽象的技术,以及在寻找均衡和执行游戏策略期间进行抽象的方法。(2)他围绕对手的行动应该如何映射到抽象模型的问题提出了方向。 他还计划确定为什么使一个人的策略不那么随机化会令人惊讶地有益。(3)他提出了并行化和抽样技术的反事实遗憾平衡发现算法,以及解决不记得游戏抽象的方法。 他还提出了有效的技术,详细的残局和中期解决,以及技术,利用残局解决找到一个均衡的整个游戏。 他还提出了一个新的计算上可行的平衡细化。(4)他提出了对结合联合收割机博弈论推理和对手建模的算法的重大可扩展性增强。 他根据最近的突破(与S.这表明完全安全的对手剥削是可能的。 他还建议研究开发、可开发性和探索之间的三方权衡。
项目成果
期刊论文数量(22)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Ignorance is Almost Bliss: Near-Optimal Stochastic Matching With Few Queries
- DOI:10.1145/2764468.2764479
- 发表时间:2014-07
- 期刊:
- 影响因子:0
- 作者:Avrim Blum;Nika Haghtalab;Ariel D. Procaccia;Ankit Sharma
- 通讯作者:Avrim Blum;Nika Haghtalab;Ariel D. Procaccia;Ankit Sharma
Superhuman AI for multiplayer poker
- DOI:10.1126/science.aay2400
- 发表时间:2019-08-30
- 期刊:
- 影响因子:56.9
- 作者:Brown, Noam;Sandholm, Tuomas
- 通讯作者:Sandholm, Tuomas
Correlation in Extensive-Form Games: Saddle-Point Formulation and Benchmarks
扩展型博弈中的相关性:鞍点公式和基准
- DOI:
- 发表时间:2019
- 期刊:
- 影响因子:0
- 作者:Farina, G;Ling, C K;Fang, F;Sandholm, T
- 通讯作者:Sandholm, T
Ex Ante Coordination and Collusion in Zero-Sum Multi-Player Extensive-Form Games
零和多人广泛博弈中的事前协调与共谋
- DOI:
- 发表时间:2018
- 期刊:
- 影响因子:0
- 作者:Farina, G;Celli, A;Gatti, N;Sandholm, T
- 通讯作者:Sandholm, T
Stable-Predictive Optimistic Counterfactual Regret Minimization
- DOI:
- 发表时间:2019-02
- 期刊:
- 影响因子:0
- 作者:Gabriele Farina;Christian Kroer;Noam Brown;T. Sandholm
- 通讯作者:Gabriele Farina;Christian Kroer;Noam Brown;T. Sandholm
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Tuomas Sandholm其他文献
Computing optimal outcomes under an expressive representation of settings with externalities
- DOI:
10.1016/j.jcss.2011.02.009 - 发表时间:
2012-01-01 - 期刊:
- 影响因子:
- 作者:
Vincent Conitzer;Tuomas Sandholm - 通讯作者:
Tuomas Sandholm
Optimal Flow Aggregation
最优流量聚合
- DOI:
10.1007/3-540-44985-x_39 - 发表时间:
2000 - 期刊:
- 影响因子:0
- 作者:
S. Suri;Tuomas Sandholm;P. Warkhede - 通讯作者:
P. Warkhede
Side constraints and non-price attributes in markets
- DOI:
10.1016/j.geb.2005.06.001 - 发表时间:
2006-05-01 - 期刊:
- 影响因子:
- 作者:
Tuomas Sandholm;Subhash Suri - 通讯作者:
Subhash Suri
Automated negotiation
- DOI:
10.1145/295685.295866 - 发表时间:
1999-03 - 期刊:
- 影响因子:0
- 作者:
Tuomas Sandholm - 通讯作者:
Tuomas Sandholm
Multiagent Systems A Modern Approach to Distributed Artificial Intelligence
- DOI:
- 发表时间:
1999 - 期刊:
- 影响因子:0
- 作者:
Tuomas Sandholm - 通讯作者:
Tuomas Sandholm
Tuomas Sandholm的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Tuomas Sandholm', 18)}}的其他基金
RI: Medium: Techniques for Massive-Scale Strategic Reasoning: Imperfect-Information Subgame Solving and Offering Guarantees in Simulation-Based Games
RI:中:大规模战略推理技术:不完美信息子博弈解决并在模拟游戏中提供保证
- 批准号:
2312342 - 财政年份:2023
- 资助金额:
$ 45万 - 项目类别:
Standard Grant
RI: Small: New Computational Techniques and Market Designs for Kidney Exchanges and Other Barter Markets
RI:小型:肾脏交换和其他易货市场的新计算技术和市场设计
- 批准号:
1718457 - 财政年份:2017
- 资助金额:
$ 45万 - 项目类别:
Standard Grant
EAGER: Exploiting a myopic opponent in imperfect-information games: Toward medical applications
EAGER:在不完美信息游戏中利用短视的对手:迈向医疗应用
- 批准号:
1546752 - 财政年份:2015
- 资助金额:
$ 45万 - 项目类别:
Standard Grant
RI: Small: Expressiveness and Automated Bundling in Mechanism Design: Principles and Computational Methodologies
RI:小:机制设计中的表现力和自动捆绑:原理和计算方法
- 批准号:
1320620 - 财政年份:2013
- 资助金额:
$ 45万 - 项目类别:
Standard Grant
AIR: Sophisticated Electronic Markets for TV Advertising, Powered by Novel Optimization
AIR:由新颖优化提供支持的复杂的电视广告电子市场
- 批准号:
1127832 - 财政年份:2011
- 资助金额:
$ 45万 - 项目类别:
Standard Grant
ICES: Small: New and Better Markets via Automated Market Making
ICES:小型:通过自动化做市创造新的、更好的市场
- 批准号:
1101668 - 财政年份:2011
- 资助金额:
$ 45万 - 项目类别:
Standard Grant
RI: Mediuim: Abstraction, Equilibrium Finding, Safe Opponent Exploitation, and Robust Strategies for Imperfect-Information Games
RI:Mediuim:不完美信息博弈的抽象、均衡发现、安全对手利用和稳健策略
- 批准号:
0964579 - 财政年份:2010
- 资助金额:
$ 45万 - 项目类别:
Continuing Grant
RI: Medium: Algorithms for Robust Barter Exchanges, with Application to Kidneys
RI:媒介:稳健的易货交换算法,适用于肾脏
- 批准号:
0905390 - 财政年份:2009
- 资助金额:
$ 45万 - 项目类别:
Standard Grant
ITR - (ECS+ASE) - (dmc+soc): Automated Mechanism Design
ITR - (ECS ASE) - (dmc soc):自动化机构设计
- 批准号:
0427858 - 财政年份:2004
- 资助金额:
$ 45万 - 项目类别:
Continuing Grant
CAREER: Coalition Formation Among Self-Interested Computationally Limited Agents
职业:在自利的、计算受限的智能体之间形成联盟
- 批准号:
0234693 - 财政年份:2001
- 资助金额:
$ 45万 - 项目类别:
Continuing Grant
相似国自然基金
昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
- 批准号:
- 批准年份:2024
- 资助金额:0.0 万元
- 项目类别:省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
- 批准号:n/a
- 批准年份:2022
- 资助金额:10.0 万元
- 项目类别:省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
- 批准号:32000033
- 批准年份:2020
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
- 批准号:31972324
- 批准年份:2019
- 资助金额:58.0 万元
- 项目类别:面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
- 批准号:81900988
- 批准年份:2019
- 资助金额:21.0 万元
- 项目类别:青年科学基金项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
- 批准号:31802058
- 批准年份:2018
- 资助金额:26.0 万元
- 项目类别:青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
- 批准号:31870821
- 批准年份:2018
- 资助金额:56.0 万元
- 项目类别:面上项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
- 批准号:31772128
- 批准年份:2017
- 资助金额:60.0 万元
- 项目类别:面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
- 批准号:81704176
- 批准年份:2017
- 资助金额:20.0 万元
- 项目类别:青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
- 批准号:91640114
- 批准年份:2016
- 资助金额:85.0 万元
- 项目类别:重大研究计划
相似海外基金
RI: Small: Computational Imaging for Underwater Exploration
RI:小型:水下勘探的计算成像
- 批准号:
2225948 - 财政年份:2022
- 资助金额:
$ 45万 - 项目类别:
Standard Grant
RI: Small: Computational Imaging for Underwater Exploration
RI:小型:水下勘探的计算成像
- 批准号:
2122068 - 财政年份:2021
- 资助金额:
$ 45万 - 项目类别:
Standard Grant
RI: Small: Modeling Co-Decisions: A Computational Framework Using Language and Metadata
RI:小型:共同决策建模:使用语言和元数据的计算框架
- 批准号:
2008761 - 财政年份:2020
- 资助金额:
$ 45万 - 项目类别:
Standard Grant
RI: Small: Collaborative Research: Computational Methods for Argument Mining: Extraction, Aggregation, and Generation
RI:小型:协作研究:参数挖掘的计算方法:提取、聚合和生成
- 批准号:
2100885 - 财政年份:2020
- 资助金额:
$ 45万 - 项目类别:
Standard Grant
RI: Small: Computational Social Choice: For the People
RI:小:计算社会选择:为了人民
- 批准号:
2024287 - 财政年份:2020
- 资助金额:
$ 45万 - 项目类别:
Standard Grant
RI: Small: Collaborative Research: Dynamic Light Transport Acquisition and Applications to Computational Illumination
RI:小型:合作研究:动态光传输采集及其在计算照明中的应用
- 批准号:
1909729 - 财政年份:2019
- 资助金额:
$ 45万 - 项目类别:
Standard Grant
RI: Small: Collaborative Research: Dynamic Light Transport Acquisition and Applications to Computational Illumination
RI:小型:合作研究:动态光传输采集及其在计算照明中的应用
- 批准号:
1909192 - 财政年份:2019
- 资助金额:
$ 45万 - 项目类别:
Standard Grant
RI: SMALL: Collaborative Research: Computational Joinery
RI:小:协作研究:计算细木工
- 批准号:
1813043 - 财政年份:2018
- 资助金额:
$ 45万 - 项目类别:
Standard Grant
RI: Small: Collaborative Research: Computational Methods for Argument Mining: Extraction, Aggregation, and Generation
RI:小型:协作研究:参数挖掘的计算方法:提取、聚合和生成
- 批准号:
1813341 - 财政年份:2018
- 资助金额:
$ 45万 - 项目类别:
Standard Grant
RI: Small: Computational analysis of eye movements in reading: reader characteristics, cognitive state, and natural language processing
RI:小:阅读中眼动的计算分析:读者特征、认知状态和自然语言处理
- 批准号:
1815529 - 财政年份:2018
- 资助金额:
$ 45万 - 项目类别:
Standard Grant