CRII: RI: Characterizing Algorithm-Relative Difficulty of Agent Benchmarks

CRII:RI:表征代理基准的算法相对难度

基本信息

  • 批准号:
    1948017
  • 负责人:
  • 金额:
    $ 17.5万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2020
  • 资助国家:
    美国
  • 起止时间:
    2020-04-01 至 2024-03-31
  • 项目状态:
    已结题

项目摘要

There are a wide variety of artificial intelligence (AI) algorithms designed to make decisions for a number of different real-world problems. One important task of AI research is to determine how well these algorithms solve various problems. Researchers often use smaller problems such as games to study algorithmic decision-making. For example, the game Go can be used to test strategic decision-making, or arcade games to test tactical decision-making. How hard these test problems are may vary for different algorithms, and can depend on factors such as how much computation time is available. The purpose of this project is to systematically understand the difficulty that AI challenge problems pose to standard decision-making algorithms, as well as how robust such conclusions are to variations in problem design, problem size, computational resources, and algorithm configuration.This project will use three methods to develop metrics for algorithm-relative benchmark difficulty, studying standard decision-making algorithms for both real-time statistical planning and reinforcement learning. First, systematic generation of scaling curves on each benchmark problem showing how performance scales with computational resources given to an agent, as well as with problem size, size of the action space, and other configurable parameters. Second, identification of problems that reliably differentiate algorithm performance, i.e., those on which some algorithms perform very well but others very poorly, illuminating their relative strengths. Third, applying recent algorithms that scale up analytical solution methods to larger problems, possibly approaching those used as more recent AI benchmarks, in order to compare scaling curves with optimal performance, when optima are possible to compute. Doing so has the potential to improve our understanding of broadly used AI and machine-learning algorithms, particularly how certain problem features impact the performance of these algorithms. Such information can potentially be used to design better and more robust algorithms that perform well across a variety of problem settings.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
有各种各样的人工智能(AI)算法,旨在为许多不同的现实世界问题做出决策。人工智能研究的一个重要任务是确定这些算法解决各种问题的能力。研究人员经常使用游戏等较小的问题来研究算法决策。例如,围棋可以用来测试战略决策,或者街机游戏可以用来测试战术决策。对于不同的算法,这些测试问题的难度可能会有所不同,并可能取决于可用计算时间等因素。本项目的目的是系统地了解人工智能挑战问题给标准决策算法带来的困难,以及这些结论对问题设计、问题大小、计算资源和算法配置的变化的健壮性。本项目将使用三种方法来制定算法相对基准难度的度量标准,研究用于实时统计规划和强化学习的标准决策算法。首先,系统地生成每个基准问题的缩放曲线,显示性能如何随给予代理的计算资源以及问题大小、动作空间大小和其他可配置参数进行缩放。第二,识别可靠地区分算法性能的问题,即某些算法在这些问题上表现得非常好,而另一些算法在这些问题上表现得很差,从而说明它们的相对优势。第三,应用最近的算法,将分析解方法扩大到更大的问题,可能接近作为更新的人工智能基准使用的算法,以便在可能计算最优时,将缩放曲线与最佳性能进行比较。这样做有可能提高我们对广泛使用的人工智能和机器学习算法的理解,特别是某些问题特征如何影响这些算法的性能。这些信息可能被用来设计更好、更健壮的算法,这些算法在各种问题设置中都表现得很好。这个奖项反映了NSF的法定使命,并通过使用基金会的智力优势和更广泛的影响审查标准进行评估,被认为值得支持。

项目成果

期刊论文数量(1)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Estimates for the Branching Factors of Atari Games
Atari 游戏分支因子的估计
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Mark Nelson其他文献

Pharmacokinetics and Safety of Saquinavir/Ritonavir and Omeprazole in HIV‐infected Subjects
沙奎那韦/利托那韦和奥美拉唑在 HIV 感染者中的药代动力学和安全性
  • DOI:
  • 发表时间:
    2008
  • 期刊:
  • 影响因子:
    0
  • 作者:
    K. Singh;L. Dickinson;Ammara Chaikan;D. Back;Courtney V. Fletcher;Anton Pozniak;Graeme Moyle;Mark Nelson;B. Gazzard;D. Herath;M. Boffito
  • 通讯作者:
    M. Boffito
New Investigator Award Recipients Poster Abstracts Presented at the 124<sup>th</sup> Annual Meeting of the American Association of Colleges of Pharmacy, July 22-25, 2023: Cross-Sectional Study of Diversity, Equity, and Inclusion Efforts of US PharmD Programs
  • DOI:
    10.1016/j.ajpe.2023.100148
  • 发表时间:
    2023-08-01
  • 期刊:
  • 影响因子:
  • 作者:
    Beatriz Manzor Mitrzyk;Sarah Vordenberg;Lizbeth Gonzalez;Paul Walker;Jolene R. Bostwick;Mark Nelson;Karen Farris
  • 通讯作者:
    Karen Farris
Risk Factor Control in Patients at High-Risk of Atherothrombosis in Australian General Practice—Local Results from the Reach Registry
  • DOI:
    10.1016/j.hlc.2007.06.485
  • 发表时间:
    2007-01-01
  • 期刊:
  • 影响因子:
  • 作者:
    Christopher M. Reid;Mark Nelson;Greg Connor;Derek Chew;Louise Shiel;Fred de Looze; on behalf of the REACH Registry Investigators
  • 通讯作者:
    on behalf of the REACH Registry Investigators
PREDICTIVE PERFORMANCE OF A POLYGENIC RISK SCORE FOR CORONARY HEART DISEASE IN A HEALTHY ELDERLY POPULATION
  • DOI:
    10.1016/s0735-1097(21)01395-4
  • 发表时间:
    2021-05-11
  • 期刊:
  • 影响因子:
  • 作者:
    Johannes Neumann;Moeen Riaz;Andrew Bakshi;Galina Polekhina;Le Thao;Mark Nelson;Robyn Woods;Gad Abraham;Michael Inouye;Christopher Reid;Andrew Tonkin;John McNeil;Paul Lacaze
  • 通讯作者:
    Paul Lacaze
The Institute of Ecotechnics: An institute devoted to developing the discipline of relating technosphere to biosphere
生态技术研究所:致力于发展技术圈与生物圈相关学科的研究所
  • DOI:
    10.1016/s0251-1088(84)92033-3
  • 发表时间:
    1984
  • 期刊:
  • 影响因子:
    0
  • 作者:
    J. Allen;T. Parrish;Mark Nelson
  • 通讯作者:
    Mark Nelson

Mark Nelson的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Mark Nelson', 18)}}的其他基金

Scale-Dependent Processing of Clustered Sensory Signals
聚类感觉信号的尺度相关处理
  • 批准号:
    0422073
  • 财政年份:
    2004
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Standard Grant
Statistical Signal Processsing Models of Electrosensory Acquisition
电传感采集的统计信号处理模型
  • 批准号:
    0078206
  • 财政年份:
    2000
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Continuing Grant
Regulation of Calcium Entry in Cerebral Arteries
脑动脉钙进入的调节
  • 批准号:
    9631416
  • 财政年份:
    1996
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Continuing Grant
Regulation of Calcium Entry in Cerebral Arteries
脑动脉钙进入的调节
  • 批准号:
    9019563
  • 财政年份:
    1991
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Continuing Grant
Regulation of Calcium Entry in Cerebral Arteries
脑动脉钙进入的调节
  • 批准号:
    8702476
  • 财政年份:
    1987
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Continuing Grant

相似国自然基金

醒脑静多靶点调控PI3K/Akt通路抑制CI/RI氧化应激—基于网络药理学及体内、外实验研究
  • 批准号:
    2025JJ90117
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
IgA-FcαRI介导的Syk/NLRP3/caspase-1通路在线状IgA大疱性皮病 中的机制研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
基于双修饰ANG-RNH1系统阻抑RI复合物生成机制建立口腔黏膜等效物血管化稳态
  • 批准号:
    82401112
  • 批准年份:
    2024
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
跨膜蛋白LRP5胞外域调控膜受体TβRI促钛表面BMSCs归巢、分化的研究
  • 批准号:
    82301120
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于“免疫-神经”网络探讨眼针活化CI/RI大鼠MC靶向H3R调节“免疫监视”的抗炎机制
  • 批准号:
    82374375
  • 批准年份:
    2023
  • 资助金额:
    51 万元
  • 项目类别:
    面上项目
Dectin-2通过促进FcεRI聚集和肥大细胞活化加剧哮喘发作的机制研究
  • 批准号:
    82300022
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
藏药甘肃蚤缀β-咔啉生物碱类TβRI抑制剂的发现及其抗肺纤维化作用机制研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
nCs通过TβRI结合并磷酸化Axin促进颌骨成骨反应的作用及机制研究
  • 批准号:
    2022J011347
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
TβRI的UFM化修饰调控TGF-β信号通路和乳腺癌转移的作用及机制研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于 FcεRI 信号通路介导的肥大细胞脱颗粒过程研究支气管哮喘的机制及中药干预
  • 批准号:
    2022JJ70115
  • 批准年份:
    2022
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目

相似海外基金

Research Infrastructure: Mid-scale RI-1 (MI:IP): X-rays for Life Sciences, Environmental Sciences, Agriculture, and Plant sciences (XLEAP)
研究基础设施:中型 RI-1 (MI:IP):用于生命科学、环境科学、农业和植物科学的 X 射线 (XLEAP)
  • 批准号:
    2330043
  • 财政年份:
    2024
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Cooperative Agreement
CRII: RI: Deep neural network pruning for fast and reliable visual detection in self-driving vehicles
CRII:RI:深度神经网络修剪,用于自动驾驶车辆中快速可靠的视觉检测
  • 批准号:
    2412285
  • 财政年份:
    2024
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Standard Grant
NSF Engines Development Award: Accelerating A Just Energy Transition Through Innovative Nature-Inclusive Offshore Wind Farms (CT,DE,MA,MD,NJ,RI,VA)
NSF 发动机开发奖:通过创新的自然包容性海上风电场加速公正的能源转型(康涅狄格州、特拉华州、马里兰州、马里兰州、新泽西州、罗德岛州、弗吉尼亚州)
  • 批准号:
    2315558
  • 财政年份:
    2024
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Cooperative Agreement
新しい口腔癌センチネルリンパ節マッピング法の確立-RI法との非劣性試験-
口腔癌前哨淋巴结定位新方法的建立-RI法非劣效性检验-
  • 批准号:
    24K20038
  • 财政年份:
    2024
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
医療用RIの大量製造に向けた大強度He二価ECRイオン源の研究開発
医用RI量产用高强度He二价ECR离子源研发
  • 批准号:
    24KJ1107
  • 财政年份:
    2024
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
RIビームを用いた医療用At-211製造技術の開発
使用 RI 光束开发医用 At-211 制造技术
  • 批准号:
    23K25132
  • 财政年份:
    2024
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Mass measurements of Ag and Pd isotopes with the Rare RI-Ring for the 2nd peak of the r-process abundance
使用 Rare RI 环对 r 过程丰度的第二个峰进行 Ag 和 Pd 同位素的质量测量
  • 批准号:
    23K22509
  • 财政年份:
    2024
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
RI: Small: Understanding Hand Interaction In The Jumble of Internet Videos
RI:小:在混乱的互联网视频中理解手部交互
  • 批准号:
    2426592
  • 财政年份:
    2024
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Standard Grant
減速RIビームを用いたフェムト・スケール量子系における相転移現象の研究
使用减速 RI 光束研究飞秒级量子系统中的相变现象
  • 批准号:
    24H00239
  • 财政年份:
    2024
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)
Collaborative Research: RI: Medium: Principles for Optimization, Generalization, and Transferability via Deep Neural Collapse
合作研究:RI:中:通过深度神经崩溃实现优化、泛化和可迁移性的原理
  • 批准号:
    2312841
  • 财政年份:
    2023
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了