Towards effective learning in Monte Carlo Tree Search
蒙特卡罗树搜索中的有效学习
基本信息
- 批准号:556170-2020
- 负责人:
- 金额:$ 2.91万
- 依托单位:
- 依托单位国家:加拿大
- 项目类别:Alliance Grants
- 财政年份:2020
- 资助国家:加拿大
- 起止时间:2020-01-01 至 2021-12-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
The combination of machine learning and heuristic search methods has achieved groundbreaking successes in recent years. Some of the best-known examples are the AlphaGo and Alpha Zero architectures recently developed by DeepMind. These approaches to computer problem-solving combine the search method of Monte Carlo Tree Search (MCTS) with the machine learning method of Deep Reinforcement Learning.
We propose research which generalizes the Alpha Zero search and learning approach, and addresses some of its shortcomings: 1. generalizing learning in MCTS to domains without a perfect simulation model, and 2. performing an in-depth study of the positive interaction between learning and search in the context of MCTS, and of possible bottlenecks for learning.
近年来,机器学习和启发式搜索方法的结合取得了突破性的成功。一些最著名的例子是DeepMind最近开发的AlphaGo和Alpha Zero架构。这些计算机解决问题的方法将蒙特卡洛树搜索(MCTS)的搜索方法与深度强化学习的机器学习方法相结合。
我们提出的研究,推广阿尔法零搜索和学习方法,并解决其一些缺点:1。将MCTS中的学习推广到没有完美仿真模型的领域; 2.对MCTS背景下学习和搜索之间的积极互动以及可能的学习瓶颈进行深入研究。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Müller, Martin其他文献
COVID-Twitter-BERT: A natural language processing model to analyse COVID-19 content on Twitter.
- DOI:
10.3389/frai.2023.1023281 - 发表时间:
2023 - 期刊:
- 影响因子:4
- 作者:
Müller, Martin;Salathe, Marcel;Kummervold, Per E. - 通讯作者:
Kummervold, Per E.
Müller, Martin的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Müller, Martin', 18)}}的其他基金
Exploration and Learning in Heuristic Search
启发式搜索中的探索和学习
- 批准号:
RGPIN-2020-04048 - 财政年份:2022
- 资助金额:
$ 2.91万 - 项目类别:
Discovery Grants Program - Individual
Towards effective learning in Monte Carlo Tree Search
蒙特卡罗树搜索中的有效学习
- 批准号:
556170-2020 - 财政年份:2021
- 资助金额:
$ 2.91万 - 项目类别:
Alliance Grants
Exploration and Learning in Heuristic Search
启发式搜索中的探索和学习
- 批准号:
RGPIN-2020-04048 - 财政年份:2021
- 资助金额:
$ 2.91万 - 项目类别:
Discovery Grants Program - Individual
Exploration and Learning in Heuristic Search
启发式搜索中的探索和学习
- 批准号:
RGPIN-2020-04048 - 财政年份:2020
- 资助金额:
$ 2.91万 - 项目类别:
Discovery Grants Program - Individual
Understanding the Role of Exploration in Search and Planning
了解探索在搜索和规划中的作用
- 批准号:
RGPIN-2015-04466 - 财政年份:2019
- 资助金额:
$ 2.91万 - 项目类别:
Discovery Grants Program - Individual
Understanding the Role of Exploration in Search and Planning
了解探索在搜索和规划中的作用
- 批准号:
RGPIN-2015-04466 - 财政年份:2018
- 资助金额:
$ 2.91万 - 项目类别:
Discovery Grants Program - Individual
Understanding the Role of Exploration in Search and Planning
了解探索在搜索和规划中的作用
- 批准号:
RGPIN-2015-04466 - 财政年份:2017
- 资助金额:
$ 2.91万 - 项目类别:
Discovery Grants Program - Individual
Creating a competitive AI agent to replace players in a multiplayer strategic board game using machine learning
使用机器学习创建一个有竞争力的人工智能代理来取代多人战略棋盘游戏中的玩家
- 批准号:
504158-2016 - 财政年份:2016
- 资助金额:
$ 2.91万 - 项目类别:
Engage Grants Program
Understanding the Role of Exploration in Search and Planning
了解探索在搜索和规划中的作用
- 批准号:
RGPIN-2015-04466 - 财政年份:2016
- 资助金额:
$ 2.91万 - 项目类别:
Discovery Grants Program - Individual
Understanding the Role of Exploration in Search and Planning
了解探索在搜索和规划中的作用
- 批准号:
RGPIN-2015-04466 - 财政年份:2015
- 资助金额:
$ 2.91万 - 项目类别:
Discovery Grants Program - Individual
相似国自然基金
多跳无线 MESH 网络中 QoS 保障算法的研究设计和性能分析
- 批准号:60902041
- 批准年份:2009
- 资助金额:20.0 万元
- 项目类别:青年科学基金项目
相似海外基金
Collaborative Research: III: Medium: Towards Effective Detection and Mitigation for Shortcut Learning: A Data Modeling Framework
协作研究:III:媒介:针对捷径学习的有效检测和缓解:数据建模框架
- 批准号:
2310262 - 财政年份:2023
- 资助金额:
$ 2.91万 - 项目类别:
Standard Grant
Collaborative Research: III: Medium: Towards Effective Detection and Mitigation for Shortcut Learning: A Data Modeling Framework
协作研究:III:媒介:针对捷径学习的有效检测和缓解:数据建模框架
- 批准号:
2310261 - 财政年份:2023
- 资助金额:
$ 2.91万 - 项目类别:
Standard Grant
Collaborative Research: III: Medium: Towards Effective Detection and Mitigation for Shortcut Learning: A Data Modeling Framework
协作研究:III:媒介:针对捷径学习的有效检测和缓解:数据建模框架
- 批准号:
2310260 - 财政年份:2023
- 资助金额:
$ 2.91万 - 项目类别:
Standard Grant
Towards intra-operative guidance in brain tumor surgery using real-time resting-state functional MRI
使用实时静息态功能 MRI 进行脑肿瘤手术的术中指导
- 批准号:
10761498 - 财政年份:2023
- 资助金额:
$ 2.91万 - 项目类别:
Towards elucidating PTSD pathogenesis with ultra-portable and low-cost neuroimaging
通过超便携式和低成本的神经影像学阐明 PTSD 发病机制
- 批准号:
10644627 - 财政年份:2023
- 资助金额:
$ 2.91万 - 项目类别:
Towards the identification of a mesoscale neural systems logic underlying innate behaviors
识别先天行为背后的中尺度神经系统逻辑
- 批准号:
10734660 - 财政年份:2023
- 资助金额:
$ 2.91万 - 项目类别:
III: Small: A New Machine Learning Paradigm Towards Effective yet Efficient Foundation Graph Learning Models
III:小型:一种新的机器学习范式,实现有效且高效的基础图学习模型
- 批准号:
2321504 - 财政年份:2023
- 资助金额:
$ 2.91万 - 项目类别:
Standard Grant
CISE-MSI: DP: IIS:III: Deep Learning Based Automated Concept and Caption Generation of Medical Images Towards Developing an Effective Decision Support System (DSS)
CISE-MSI:DP:IIS:III:基于深度学习的医学图像自动概念和标题生成,以开发有效的决策支持系统 (DSS)
- 批准号:
2131207 - 财政年份:2022
- 资助金额:
$ 2.91万 - 项目类别:
Standard Grant
Towards Effective and Interpretable Deep Learning Applications for Microscopic Medical Imaging
面向显微医学成像的有效且可解释的深度学习应用
- 批准号:
RGPIN-2020-06785 - 财政年份:2022
- 资助金额:
$ 2.91万 - 项目类别:
Discovery Grants Program - Individual
Lung Biomechanical Modelling Driven by Machine Learning Algorithm Towards Effective Lung Cancer Radiation Therapy
机器学习算法驱动的肺部生物力学建模实现有效的肺癌放射治疗
- 批准号:
RGPIN-2019-06619 - 财政年份:2022
- 资助金额:
$ 2.91万 - 项目类别:
Discovery Grants Program - Individual