CIF: Small: Theory and Algorithms for Efficient and Large-Scale Monte Carlo Tree Search

CIF:小型:高效大规模蒙特卡罗树搜索的理论和算法

基本信息

  • 批准号:
    2327013
  • 负责人:
  • 金额:
    $ 59.92万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2023
  • 资助国家:
    美国
  • 起止时间:
    2023-12-01 至 2026-11-30
  • 项目状态:
    未结题

项目摘要

Monte Carlo tree search (MCTS) is a versatile online planning methodology for sequential decision-making problems such as reinforcement learning that has recently shown empirical success in real-world problems including games, chemical synthesis, materials/drug discovery, and numerical algorithms. However, there is a huge gap between existing MCTS theory and practice because (i) the de facto standard MCTS algorithm called upper confidence bound for trees (UCT) is known to be provably suboptimal, (ii) existing theories are limited to asymptotic or worst-case analyses, and (iii) the optimal performance rates of MCTS algorithms are not known. This implies that the state-of-the-art MCTS methods might still be far from realizing their full potential, and further developments are required to prepare for the next generations of much larger and more complex decision-making problems. This project focuses on bridging the gap between theory and practice in MCTS methodology by developing novel MCTS algorithms with strong mathematical performance guarantees, establishing the optimal performance rates, and evaluating them in real-world applications. This project integrates education into research by developing a course module and building interdisciplinary teams of undergraduates who will work closely with material scientists to evaluate the developed algorithms on materials discovery tasks. The project consists of three main directions: the foundations of MCTS, large-scale MCTS, and the design of experiments for MCTS. Each direction contains several main objectives: (i) for the foundations of MCTS, the focus is to improve maximum mean estimator and leverage tools from a related problem called pure exploration to develop algorithms with strong guarantees and study information-theoretic limits of MCTS; (ii) for the large-scale MCTS, the focus is to analyze and improve existing heuristics for large-scale MCTS problems such as progressive widening, incremental depth expansion, and function approximations; (iii) for the design of experiments for MCTS, the focus is to develop experimental design methods to efficiently train function approximations for MCTS with a small number of samples. In addition to theoretical and algorithmic developments, the project also aims at implementing all algorithms developed as open-source software, evaluating them using benchmark datasets, and applying them to material science tasks via the interdisciplinary teams of undergraduates as part of the educational aim.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
蒙特卡罗树搜索(MCTS)是一种多功能的在线规划方法,用于顺序决策问题,例如强化学习,最近在现实世界的问题中取得了经验性的成功,包括游戏,化学合成,材料/药物发现和数值算法。 然而,现有的MCTS理论和实践之间存在巨大的差距,因为(i)事实上的标准MCTS算法称为树的置信上限(UCT)被证明是次优的,(ii)现有的理论仅限于渐近或最坏情况下的分析,和(iii)MCTS算法的最佳性能率是未知的。 这意味着,最先进的MCTS方法可能还远远没有实现其全部潜力,需要进一步发展,为下一代更大和更复杂的决策问题做好准备。 该项目的重点是弥合理论和实践之间的差距,在MCTS方法,开发新的MCTS算法具有强大的数学性能保证,建立最佳的性能率,并在现实世界中的应用程序进行评估差距。 该项目通过开发课程模块和建立跨学科的本科生团队,将教育融入研究,他们将与材料科学家密切合作,评估材料发现任务的开发算法。该项目包括三个主要方向:MCTS的基础,大规模MCTS和MCTS的实验设计。 每个方向包含几个主要目标:(i)对于MCTS的基础,重点是改进最大均值估计,并利用相关问题(称为纯探索)中的工具开发具有强保证的算法,并研究MCTS的信息论极限;(ii)对于大型MCTS,重点是分析和改进大型MCTS问题的现有算法,例如渐进加宽,增量深度扩展和函数逼近;(iii)对于MCTS的实验设计,重点是开发实验设计方法,以便用少量样本有效地训练MCTS的函数逼近。 除了理论和算法的发展,该项目还旨在实现作为开源软件开发的所有算法,使用基准数据集对其进行评估,该奖项反映了NSF的法定使命,并被认为值得通过使用基金会的智力价值和更广泛的评估来支持。影响审查标准。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Kwang-Sung Jun其他文献

Kwang-Sung Jun的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

相似国自然基金

昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
  • 批准号:
    n/a
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
  • 批准号:
    32000033
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
  • 批准号:
    31972324
  • 批准年份:
    2019
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
  • 批准号:
    81900988
  • 批准年份:
    2019
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
  • 批准号:
    31802058
  • 批准年份:
    2018
  • 资助金额:
    26.0 万元
  • 项目类别:
    青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
  • 批准号:
    31870821
  • 批准年份:
    2018
  • 资助金额:
    56.0 万元
  • 项目类别:
    面上项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
  • 批准号:
    31772128
  • 批准年份:
    2017
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
  • 批准号:
    81704176
  • 批准年份:
    2017
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
  • 批准号:
    91640114
  • 批准年份:
    2016
  • 资助金额:
    85.0 万元
  • 项目类别:
    重大研究计划

相似海外基金

Collaborative Research: CIF: Small: Theory for Learning Lossless and Lossy Coding
协作研究:CIF:小型:学习无损和有损编码的理论
  • 批准号:
    2324396
  • 财政年份:
    2023
  • 资助金额:
    $ 59.92万
  • 项目类别:
    Standard Grant
Collaborative Research: CIF: Small: New Theory, Algorithms and Applications for Large-Scale Bilevel Optimization
合作研究:CIF:小型:大规模双层优化的新理论、算法和应用
  • 批准号:
    2311274
  • 财政年份:
    2023
  • 资助金额:
    $ 59.92万
  • 项目类别:
    Standard Grant
Collaborative Research: CIF: Small: New Theory, Algorithms and Applications for Large-Scale Bilevel Optimization
合作研究:CIF:小型:大规模双层优化的新理论、算法和应用
  • 批准号:
    2311275
  • 财政年份:
    2023
  • 资助金额:
    $ 59.92万
  • 项目类别:
    Standard Grant
CIF: Small: Shared Information: Theory and Applications
CIF:小:共享信息:理论与应用
  • 批准号:
    2310203
  • 财政年份:
    2023
  • 资助金额:
    $ 59.92万
  • 项目类别:
    Standard Grant
Collaborative Research: CIF: Small: Theory for Learning Lossless and Lossy Coding
协作研究:CIF:小型:学习无损和有损编码的理论
  • 批准号:
    2324397
  • 财政年份:
    2023
  • 资助金额:
    $ 59.92万
  • 项目类别:
    Standard Grant
CIF: Small: Multidimensional Remaindering Theory and Applications
CIF:小:多维余数理论与应用
  • 批准号:
    2246917
  • 财政年份:
    2023
  • 资助金额:
    $ 59.92万
  • 项目类别:
    Standard Grant
Collaborative Research: CIF: Small: New Theory and Applications of Non-smooth and Non-Lipschitz Riemannian Optimization
合作研究:CIF:小:非光滑和非Lipschitz黎曼优化的新理论和应用
  • 批准号:
    2308597
  • 财政年份:
    2022
  • 资助金额:
    $ 59.92万
  • 项目类别:
    Standard Grant
Collaborative Research: CIF: Small: New Theory and Applications of Non-smooth and Non-Lipschitz Riemannian Optimization
合作研究:CIF:小:非光滑和非Lipschitz黎曼优化的新理论和应用
  • 批准号:
    2007797
  • 财政年份:
    2020
  • 资助金额:
    $ 59.92万
  • 项目类别:
    Standard Grant
CIF: Small: Poisson matching: A new tool for information theory
CIF:小:泊松匹配:信息论的新工具
  • 批准号:
    2007965
  • 财政年份:
    2020
  • 资助金额:
    $ 59.92万
  • 项目类别:
    Standard Grant
CIF: Small: Timing Optimization Over Random Network Asynchrony - Theory And Distributed Algorithms
CIF:小:随机网络异步的时序优化 - 理论和分布式算法
  • 批准号:
    2008527
  • 财政年份:
    2020
  • 资助金额:
    $ 59.92万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了