Improving AI Performance in Complex Real-Time Scenarios with Hierarchical Reinforcement Learning and Counterfactual Regret Minimization

通过分层强化学习和反事实遗憾最小化提高复杂实时场景中的人工智能性能

基本信息

  • 批准号:
    2590735
  • 负责人:
  • 金额:
    --
  • 依托单位:
  • 依托单位国家:
    英国
  • 项目类别:
    Studentship
  • 财政年份:
    2021
  • 资助国家:
    英国
  • 起止时间:
    2021 至 无数据
  • 项目状态:
    已结题

项目摘要

Recent milestones in Game Artificial Intelligence (AI) brought forth expert solutions for playing the games of Go, Chess, Poker, Dota2, and StarCraft II. Especially the last title highlighted the applicability of AI in complex real-time scenarios, yet only through massive Neural Network (NN) architectures. Hierarchical Reinforcement Learning provides managerial structure to an agent's decision-making process, while Counterfactual Regret Minimization evaluates action-decision making by learning from hindsight. Combining both may reduce the network size, that agents require to handle environments equally difficult to StarCraft II, or even more complex ones, such as Wargames. Upon success, the methods developed in this study could reach state-of-the-art performance in Real-Time Strategy (RTS) games environments, which could not only be used to enhance the experience of players in diverse RTS games but also push forward AI employability in real-world decision-making scenarios.
游戏人工智能(AI)的最新里程碑为围棋、国际象棋、扑克、Dota2和星际争霸II等游戏带来了专家解决方案。特别是最后一个标题强调了人工智能在复杂实时场景中的适用性,但只有通过大规模神经网络(NN)架构。分层强化学习为智能体的决策过程提供了管理结构,而反事实后悔最小化则通过事后学习来评估行动决策。两者结合可以减少网络规模,智能体需要处理与星际争霸II一样困难的环境,甚至更复杂的环境,如战争游戏。一旦成功,本研究中开发的方法可以在实时战略(RTS)游戏环境中达到最先进的性能,这不仅可以用于增强玩家在各种RTS游戏中的体验,还可以推动AI在现实世界决策场景中的可应用性。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

其他文献

吉治仁志 他: "トランスジェニックマウスによるTIMP-1の線維化促進機序"最新医学. 55. 1781-1787 (2000)
Hitoshi Yoshiji 等:“转基因小鼠中 TIMP-1 的促纤维化机制”现代医学 55. 1781-1787 (2000)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
LiDAR Implementations for Autonomous Vehicle Applications
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
生命分子工学・海洋生命工学研究室
生物分子工程/海洋生物技术实验室
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
吉治仁志 他: "イラスト医学&サイエンスシリーズ血管の分子医学"羊土社(渋谷正史編). 125 (2000)
Hitoshi Yoshiji 等人:“血管医学与科学系列分子医学图解”Yodosha(涉谷正志编辑)125(2000)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Effect of manidipine hydrochloride,a calcium antagonist,on isoproterenol-induced left ventricular hypertrophy: "Yoshiyama,M.,Takeuchi,K.,Kim,S.,Hanatani,A.,Omura,T.,Toda,I.,Akioka,K.,Teragaki,M.,Iwao,H.and Yoshikawa,J." Jpn Circ J. 62(1). 47-52 (1998)
钙拮抗剂盐酸马尼地平对异丙肾上腺素引起的左心室肥厚的影响:“Yoshiyama,M.,Takeuchi,K.,Kim,S.,Hanatani,A.,Omura,T.,Toda,I.,Akioka,
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:

的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('', 18)}}的其他基金

An implantable biosensor microsystem for real-time measurement of circulating biomarkers
用于实时测量循环生物标志物的植入式生物传感器微系统
  • 批准号:
    2901954
  • 财政年份:
    2028
  • 资助金额:
    --
  • 项目类别:
    Studentship
Exploiting the polysaccharide breakdown capacity of the human gut microbiome to develop environmentally sustainable dishwashing solutions
利用人类肠道微生物群的多糖分解能力来开发环境可持续的洗碗解决方案
  • 批准号:
    2896097
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
A Robot that Swims Through Granular Materials
可以在颗粒材料中游动的机器人
  • 批准号:
    2780268
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
Likelihood and impact of severe space weather events on the resilience of nuclear power and safeguards monitoring.
严重空间天气事件对核电和保障监督的恢复力的可能性和影响。
  • 批准号:
    2908918
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
Proton, alpha and gamma irradiation assisted stress corrosion cracking: understanding the fuel-stainless steel interface
质子、α 和 γ 辐照辅助应力腐蚀开裂:了解燃料-不锈钢界面
  • 批准号:
    2908693
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
Field Assisted Sintering of Nuclear Fuel Simulants
核燃料模拟物的现场辅助烧结
  • 批准号:
    2908917
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
Assessment of new fatigue capable titanium alloys for aerospace applications
评估用于航空航天应用的新型抗疲劳钛合金
  • 批准号:
    2879438
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
Developing a 3D printed skin model using a Dextran - Collagen hydrogel to analyse the cellular and epigenetic effects of interleukin-17 inhibitors in
使用右旋糖酐-胶原蛋白水凝胶开发 3D 打印皮肤模型,以分析白细胞介素 17 抑制剂的细胞和表观遗传效应
  • 批准号:
    2890513
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
CDT year 1 so TBC in Oct 2024
CDT 第 1 年,预计 2024 年 10 月
  • 批准号:
    2879865
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
Understanding the interplay between the gut microbiome, behavior and urbanisation in wild birds
了解野生鸟类肠道微生物组、行为和城市化之间的相互作用
  • 批准号:
    2876993
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship

相似国自然基金

联邦学习驱动下成渝地区职业教育AI产教协同的跨区域数据共享机制与培养方案优化要素机理研究
  • 批准号:
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
AI驱动药物研发的技术发展趋势及重庆技术创新路径选择战略研究
  • 批准号:
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
AI赋能职业教育:“智慧职教”平台教学视频核心知识抽取研究
  • 批准号:
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
基于AI 技术的高校网络舆情监测与治理路径研究
  • 批准号:
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
患者安全视角下医疗AI技术对医务人员风险感知的双刃剑机制研究
  • 批准号:
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
基于可穿戴设备与AI动态优化的阿尔茨海默病早期生活方式干预系统研发及效应研究
  • 批准号:
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
成渝交通一体化背景下的高速公路智慧管控系统:大数据驱动、AI预警与数智决策
  • 批准号:
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
基于AI的光谱-色度耦合动态调控系统技术研究及其在城乡建筑光环境优化中的应用
  • 批准号:
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
多模态下AI技术融合在教育创新中的应用与关键技术研究
  • 批准号:
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
基于职业教育和产学研协同的低成本专用大模型AI系统研究
  • 批准号:
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目

相似海外基金

An innovative platform using ML/AI to analyse farm data and deliver insights to improve farm performance, increasing farm profitability by 5-10%
An%20innovative%20platform%20using%20ML/AI%20to%20analysis%20farm%20data%20and%20deliver%20insights%20to%20improv%20farm%20performance,%20increasing%20farm%20profitability%20by%205-10%
  • 批准号:
    10093235
  • 财政年份:
    2024
  • 资助金额:
    --
  • 项目类别:
    Collaborative R&D
Advanced AI and RobotIcS for autonomous task pErformance
先进的人工智能和机器人控制系统可实现自主任务执行
  • 批准号:
    10110390
  • 财政年份:
    2024
  • 资助金额:
    --
  • 项目类别:
    EU-Funded
CAREER: Improving Real-world Performance of AI Biosignal Algorithms
职业:提高人工智能生物信号算法的实际性能
  • 批准号:
    2339669
  • 财政年份:
    2024
  • 资助金额:
    --
  • 项目类别:
    Continuing Grant
Collaborative Research: OAC: Core: Harvesting Idle Resources Safely and Timely for Large-scale AI Applications in High-Performance Computing Systems
合作研究:OAC:核心:安全及时地收集闲置资源,用于高性能计算系统中的大规模人工智能应用
  • 批准号:
    2403399
  • 财政年份:
    2024
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
ENORMITY: pErformance beNchmark Of Ramon space nustreaM wITh klepsYdra ai
巨大:Ramon space nustream 与 klepsYdra ai 的性能基准
  • 批准号:
    10089138
  • 财政年份:
    2024
  • 资助金额:
    --
  • 项目类别:
    Collaborative R&D
Collaborative Research: OAC: Core: Harvesting Idle Resources Safely and Timely for Large-scale AI Applications in High-Performance Computing Systems
合作研究:OAC:核心:安全及时地收集闲置资源,用于高性能计算系统中的大规模人工智能应用
  • 批准号:
    2403398
  • 财政年份:
    2024
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
Development of high-performance Si-based spin transistors toward AI electronics technologies
面向人工智能电子技术开发高性能硅基自旋晶体管
  • 批准号:
    23H00177
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)
Integrated Event-Based SoC: Revolutionizing Sensor and AI Processor Performance with Low-Latency, Energy-Efficient Neuromorphic Computing
基于事件的集成 SoC:通过低延迟、节能的神经拟态计算彻底改变传感器和 AI 处理器的性能
  • 批准号:
    10072308
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
    Grant for R&D
Autonomous AI Assisted Salt Selection for Stability and Performance
自主人工智能辅助盐选择以提高稳定性和性能
  • 批准号:
    2890482
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
    Studentship
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了