Exploration and Learning in Heuristic Search
启发式搜索中的探索和学习
基本信息
- 批准号:RGPIN-2020-04048
- 负责人:
- 金额:$ 2.55万
- 依托单位:
- 依托单位国家:加拿大
- 项目类别:Discovery Grants Program - Individual
- 财政年份:2020
- 资助国家:加拿大
- 起止时间:2020-01-01 至 2021-12-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
Research in Computing Science progresses towards the goal of solving ever more complex, difficult real-world problems. Intelligent automated decision-making requires modelling an application domain, and processing a potentially huge space of possible future alternatives. With my research group and my colleagues I study efficient search algorithms for solving hard decision-making problems. The current proposal focuses on two topics: the question of efficient exploration in large search spaces, and the use of machine learning methods. These topics have emerged as big common themes that drive much of my group's recent work in a diverse set of application areas.
My research area has radically changed over the last five years. Systems that combine deep reinforcement learning with Monte Carlo Tree Search have achieved super-human performance in complex games such as Go, chess and shogi. DeepMind's Alpha Zero system has learned to play such games from scratch, without any human input regarding playing strategy. A beautiful aspect of these systems is the way in which they combine learning and search. They create a virtuous cycle where machine learning improves the search process, and the search also improves the learning.
Despite the impressive successes of these algorithms, a number of problems of both practical and fundamental nature currently limits their more widespread use. A major practical problem is posed by the massive resources required to train the large and deep neural networks which encode the learned knowledge. More fundamental questions include: how to control the search process? And how to generalize such approaches when we don't have a perfect and efficient model of a problem?
In future work with my students and colleagues, I want to study the following topics in depth:
1. Continue the study of exploration in heuristic search
2. Extend our methods to problems beyond games, which are less well specified
3. Study learning and search in cases where we know the "true result" due to their special mathematical structure
To study these research questions, I plan to continue working on concrete applications which pose significant challenges. I want to continue building complete high performance systems, and test them on standard benchmarks as well as in competitions.
A deeper understanding of these methods will likely lead to further significantly improved decision-making systems, which can search and learn better and faster, and can be used for less well-defined problems.
计算科学的研究朝着解决越来越复杂,困难的现实世界问题的目标前进。智能自动化决策需要对应用程序域进行建模,并处理潜在的巨大空间的未来可能的替代方案。我和我的研究小组以及同事们一起研究解决困难决策问题的高效搜索算法。目前的提案集中在两个主题上:在大搜索空间中进行有效探索的问题,以及机器学习方法的使用。这些主题已经成为一个大的共同主题,推动了我的团队最近在不同应用领域的大部分工作。
我的研究领域在过去五年里发生了根本性的变化。将联合收割机深度强化学习与蒙特卡洛树搜索相结合的系统在围棋、国际象棋和将棋等复杂游戏中实现了超人的表现。DeepMind的Alpha Zero系统已经学会了从头开始玩这样的游戏,没有任何关于游戏策略的人类输入。这些系统的一个美丽的方面是它们将联合收割机学习和搜索结合在一起的方式。它们创造了一个良性循环,机器学习改善了搜索过程,搜索也改善了学习。
尽管这些算法取得了令人印象深刻的成功,但一些实际和基本性质的问题目前限制了它们的更广泛的使用。一个主要的实际问题是训练编码学习知识的大型深度神经网络所需的大量资源。更基本的问题包括:如何控制搜索过程?当我们没有一个完美有效的问题模型时,如何推广这些方法?
在未来的工作中,我想与我的学生和同事深入研究以下主题:
1.继续探索启发式搜索的研究
2.将我们的方法扩展到游戏之外的问题,这些问题不太明确
3.研究学习和搜索的情况下,我们知道“真正的结果”,由于其特殊的数学结构
为了研究这些研究问题,我计划继续致力于提出重大挑战的具体应用。我想继续构建完整的高性能系统,并在标准基准测试和比赛中测试它们。
对这些方法的更深入理解可能会导致决策系统的进一步显著改进,这些系统可以更好更快地搜索和学习,并可用于定义不太明确的问题。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Müller, Martin其他文献
COVID-Twitter-BERT: A natural language processing model to analyse COVID-19 content on Twitter.
- DOI:
10.3389/frai.2023.1023281 - 发表时间:
2023 - 期刊:
- 影响因子:4
- 作者:
Müller, Martin;Salathe, Marcel;Kummervold, Per E. - 通讯作者:
Kummervold, Per E.
Müller, Martin的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Müller, Martin', 18)}}的其他基金
Exploration and Learning in Heuristic Search
启发式搜索中的探索和学习
- 批准号:
RGPIN-2020-04048 - 财政年份:2022
- 资助金额:
$ 2.55万 - 项目类别:
Discovery Grants Program - Individual
Towards effective learning in Monte Carlo Tree Search
蒙特卡罗树搜索中的有效学习
- 批准号:
556170-2020 - 财政年份:2021
- 资助金额:
$ 2.55万 - 项目类别:
Alliance Grants
Exploration and Learning in Heuristic Search
启发式搜索中的探索和学习
- 批准号:
RGPIN-2020-04048 - 财政年份:2021
- 资助金额:
$ 2.55万 - 项目类别:
Discovery Grants Program - Individual
Towards effective learning in Monte Carlo Tree Search
蒙特卡罗树搜索中的有效学习
- 批准号:
556170-2020 - 财政年份:2020
- 资助金额:
$ 2.55万 - 项目类别:
Alliance Grants
Understanding the Role of Exploration in Search and Planning
了解探索在搜索和规划中的作用
- 批准号:
RGPIN-2015-04466 - 财政年份:2019
- 资助金额:
$ 2.55万 - 项目类别:
Discovery Grants Program - Individual
Understanding the Role of Exploration in Search and Planning
了解探索在搜索和规划中的作用
- 批准号:
RGPIN-2015-04466 - 财政年份:2018
- 资助金额:
$ 2.55万 - 项目类别:
Discovery Grants Program - Individual
Understanding the Role of Exploration in Search and Planning
了解探索在搜索和规划中的作用
- 批准号:
RGPIN-2015-04466 - 财政年份:2017
- 资助金额:
$ 2.55万 - 项目类别:
Discovery Grants Program - Individual
Creating a competitive AI agent to replace players in a multiplayer strategic board game using machine learning
使用机器学习创建一个有竞争力的人工智能代理来取代多人战略棋盘游戏中的玩家
- 批准号:
504158-2016 - 财政年份:2016
- 资助金额:
$ 2.55万 - 项目类别:
Engage Grants Program
Understanding the Role of Exploration in Search and Planning
了解探索在搜索和规划中的作用
- 批准号:
RGPIN-2015-04466 - 财政年份:2016
- 资助金额:
$ 2.55万 - 项目类别:
Discovery Grants Program - Individual
Understanding the Role of Exploration in Search and Planning
了解探索在搜索和规划中的作用
- 批准号:
RGPIN-2015-04466 - 财政年份:2015
- 资助金额:
$ 2.55万 - 项目类别:
Discovery Grants Program - Individual
相似国自然基金
Scalable Learning and Optimization: High-dimensional Models and Online Decision-Making Strategies for Big Data Analysis
- 批准号:
- 批准年份:2024
- 资助金额:万元
- 项目类别:合作创新研究团队
Understanding structural evolution of galaxies with machine learning
- 批准号:n/a
- 批准年份:2022
- 资助金额:10.0 万元
- 项目类别:省市级项目
煤矿安全人机混合群智感知任务的约束动态多目标Q-learning进化分配
- 批准号:
- 批准年份:2022
- 资助金额:30 万元
- 项目类别:青年科学基金项目
基于领弹失效考量的智能弹药编队短时在线Q-learning协同控制机理
- 批准号:62003314
- 批准年份:2020
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
集成上下文张量分解的e-learning资源推荐方法研究
- 批准号:61902016
- 批准年份:2019
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
具有时序迁移能力的Spiking-Transfer learning (脉冲-迁移学习)方法研究
- 批准号:61806040
- 批准年份:2018
- 资助金额:20.0 万元
- 项目类别:青年科学基金项目
基于Deep-learning的三江源区冰川监测动态识别技术研究
- 批准号:51769027
- 批准年份:2017
- 资助金额:38.0 万元
- 项目类别:地区科学基金项目
具有时序处理能力的Spiking-Deep Learning(脉冲深度学习)方法研究
- 批准号:61573081
- 批准年份:2015
- 资助金额:64.0 万元
- 项目类别:面上项目
基于有向超图的大型个性化e-learning学习过程模型的自动生成与优化
- 批准号:61572533
- 批准年份:2015
- 资助金额:66.0 万元
- 项目类别:面上项目
E-Learning中学习者情感补偿方法的研究
- 批准号:61402392
- 批准年份:2014
- 资助金额:26.0 万元
- 项目类别:青年科学基金项目
相似海外基金
Improving Heuristic Search by Machine Learning
通过机器学习改进启发式搜索
- 批准号:
RGPIN-2021-03205 - 财政年份:2022
- 资助金额:
$ 2.55万 - 项目类别:
Discovery Grants Program - Individual
Exploration and Learning in Heuristic Search
启发式搜索中的探索和学习
- 批准号:
RGPIN-2020-04048 - 财政年份:2022
- 资助金额:
$ 2.55万 - 项目类别:
Discovery Grants Program - Individual
Statistical mechanics of heuristic methods in multi-stage learning
多阶段学习中启发式方法的统计机制
- 批准号:
21K21310 - 财政年份:2021
- 资助金额:
$ 2.55万 - 项目类别:
Grant-in-Aid for Research Activity Start-up
Improving Heuristic Search by Machine Learning
通过机器学习改进启发式搜索
- 批准号:
RGPIN-2021-03205 - 财政年份:2021
- 资助金额:
$ 2.55万 - 项目类别:
Discovery Grants Program - Individual
Improving Heuristic Search by Machine Learning
通过机器学习改进启发式搜索
- 批准号:
DGECR-2021-00119 - 财政年份:2021
- 资助金额:
$ 2.55万 - 项目类别:
Discovery Launch Supplement
Exploration and Learning in Heuristic Search
启发式搜索中的探索和学习
- 批准号:
RGPIN-2020-04048 - 财政年份:2021
- 资助金额:
$ 2.55万 - 项目类别:
Discovery Grants Program - Individual
Machine learning and heuristic search
机器学习和启发式搜索
- 批准号:
46246-2007 - 财政年份:2011
- 资助金额:
$ 2.55万 - 项目类别:
Discovery Grants Program - Individual
Massively Parallelized Learning Real-time Heuristic Search
大规模并行学习实时启发式搜索
- 批准号:
393570-2010 - 财政年份:2010
- 资助金额:
$ 2.55万 - 项目类别:
Alexander Graham Bell Canada Graduate Scholarships - Master's
Machine learning and heuristic search
机器学习和启发式搜索
- 批准号:
46246-2007 - 财政年份:2010
- 资助金额:
$ 2.55万 - 项目类别:
Discovery Grants Program - Individual
Machine learning and heuristic search
机器学习和启发式搜索
- 批准号:
46246-2007 - 财政年份:2009
- 资助金额:
$ 2.55万 - 项目类别:
Discovery Grants Program - Individual