Exploration and Learning in Heuristic Search
启发式搜索中的探索和学习
基本信息
- 批准号:RGPIN-2020-04048
- 负责人:
- 金额:$ 2.55万
- 依托单位:
- 依托单位国家:加拿大
- 项目类别:Discovery Grants Program - Individual
- 财政年份:2022
- 资助国家:加拿大
- 起止时间:2022-01-01 至 2023-12-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
Research in Computing Science progresses towards the goal of solving ever more complex, difficult real-world problems. Intelligent automated decision-making requires modelling an application domain, and processing a potentially huge space of possible future alternatives. With my research group and my colleagues I study efficient search algorithms for solving hard decision-making problems. The current proposal focuses on two topics: the question of efficient exploration in large search spaces, and the use of machine learning methods. These topics have emerged as big common themes that drive much of my group's recent work in a diverse set of application areas. My research area has radically changed over the last five years. Systems that combine deep reinforcement learning with Monte Carlo Tree Search have achieved super-human performance in complex games such as Go, chess and shogi. DeepMind's Alpha Zero system has learned to play such games from scratch, without any human input regarding playing strategy. A beautiful aspect of these systems is the way in which they combine learning and search. They create a virtuous cycle where machine learning improves the search process, and the search also improves the learning. Despite the impressive successes of these algorithms, a number of problems of both practical and fundamental nature currently limits their more widespread use. A major practical problem is posed by the massive resources required to train the large and deep neural networks which encode the learned knowledge. More fundamental questions include: how to control the search process? And how to generalize such approaches when we don't have a perfect and efficient model of a problem? In future work with my students and colleagues, I want to study the following topics in depth: 1. Continue the study of exploration in heuristic search 2. Extend our methods to problems beyond games, which are less well specified 3. Study learning and search in cases where we know the "true result" due to their special mathematical structure To study these research questions, I plan to continue working on concrete applications which pose significant challenges. I want to continue building complete high performance systems, and test them on standard benchmarks as well as in competitions. A deeper understanding of these methods will likely lead to further significantly improved decision-making systems, which can search and learn better and faster, and can be used for less well-defined problems.
计算科学的研究朝着解决更复杂、更困难的现实世界问题的目标前进。智能自动化决策需要对应用领域进行建模,并处理未来可能替代方案的潜在巨大空间。我和我的研究小组和我的同事们研究高效的搜索算法来解决困难的决策问题。目前的提案侧重于两个主题:在大型搜索空间中进行有效探索的问题,以及机器学习方法的使用。这些主题已经成为大的共同主题,推动了我的团队最近在一系列不同的应用领域的大部分工作。在过去的五年里,我的研究领域发生了根本性的变化。将深度强化学习与蒙特卡洛树搜索相结合的系统在围棋、国际象棋和围棋等复杂游戏中取得了超人的表现。DeepMind的Alpha Zero系统已经学会了从零开始玩这样的游戏,而不需要任何关于游戏策略的人工输入。这些系统的一个优点是将学习和搜索结合在一起的方式。它们创造了一个良性循环,其中机器学习改善了搜索过程,搜索也改善了学习。尽管这些算法取得了令人印象深刻的成功,但目前许多实际和基本性质的问题限制了它们更广泛的使用。一个主要的实际问题是需要大量的资源来训练编码所学知识的大而深的神经网络。更基本的问题包括:如何控制搜索过程?当我们没有一个完美而有效的问题模型时,如何推广这些方法?在未来与我的学生和同事的工作中,我想深入研究以下主题:1.继续研究启发式搜索中的探索2.将我们的方法扩展到游戏之外的问题,这些问题没有很好地说明3.研究学习和搜索在由于特殊的数学结构而知道“真实结果”的情况下,为了研究这些研究问题,我计划继续致力于构成重大挑战的具体应用。我想继续构建完整的高性能系统,并在标准基准和比赛中测试它们。对这些方法的深入理解可能会导致进一步显著改进的决策系统,它可以更好、更快地搜索和学习,并可用于定义较不明确的问题。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Müller, Martin其他文献
COVID-Twitter-BERT: A natural language processing model to analyse COVID-19 content on Twitter.
- DOI:
10.3389/frai.2023.1023281 - 发表时间:
2023 - 期刊:
- 影响因子:4
- 作者:
Müller, Martin;Salathe, Marcel;Kummervold, Per E. - 通讯作者:
Kummervold, Per E.
Müller, Martin的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Müller, Martin', 18)}}的其他基金
Towards effective learning in Monte Carlo Tree Search
蒙特卡罗树搜索中的有效学习
- 批准号:
556170-2020 - 财政年份:2021
- 资助金额:
$ 2.55万 - 项目类别:
Alliance Grants
Exploration and Learning in Heuristic Search
启发式搜索中的探索和学习
- 批准号:
RGPIN-2020-04048 - 财政年份:2021
- 资助金额:
$ 2.55万 - 项目类别:
Discovery Grants Program - Individual
Towards effective learning in Monte Carlo Tree Search
蒙特卡罗树搜索中的有效学习
- 批准号:
556170-2020 - 财政年份:2020
- 资助金额:
$ 2.55万 - 项目类别:
Alliance Grants
Exploration and Learning in Heuristic Search
启发式搜索中的探索和学习
- 批准号:
RGPIN-2020-04048 - 财政年份:2020
- 资助金额:
$ 2.55万 - 项目类别:
Discovery Grants Program - Individual
Understanding the Role of Exploration in Search and Planning
了解探索在搜索和规划中的作用
- 批准号:
RGPIN-2015-04466 - 财政年份:2019
- 资助金额:
$ 2.55万 - 项目类别:
Discovery Grants Program - Individual
Understanding the Role of Exploration in Search and Planning
了解探索在搜索和规划中的作用
- 批准号:
RGPIN-2015-04466 - 财政年份:2018
- 资助金额:
$ 2.55万 - 项目类别:
Discovery Grants Program - Individual
Understanding the Role of Exploration in Search and Planning
了解探索在搜索和规划中的作用
- 批准号:
RGPIN-2015-04466 - 财政年份:2017
- 资助金额:
$ 2.55万 - 项目类别:
Discovery Grants Program - Individual
Creating a competitive AI agent to replace players in a multiplayer strategic board game using machine learning
使用机器学习创建一个有竞争力的人工智能代理来取代多人战略棋盘游戏中的玩家
- 批准号:
504158-2016 - 财政年份:2016
- 资助金额:
$ 2.55万 - 项目类别:
Engage Grants Program
Understanding the Role of Exploration in Search and Planning
了解探索在搜索和规划中的作用
- 批准号:
RGPIN-2015-04466 - 财政年份:2016
- 资助金额:
$ 2.55万 - 项目类别:
Discovery Grants Program - Individual
Understanding the Role of Exploration in Search and Planning
了解探索在搜索和规划中的作用
- 批准号:
RGPIN-2015-04466 - 财政年份:2015
- 资助金额:
$ 2.55万 - 项目类别:
Discovery Grants Program - Individual
相似国自然基金
Scalable Learning and Optimization: High-dimensional Models and Online Decision-Making Strategies for Big Data Analysis
- 批准号:
- 批准年份:2024
- 资助金额:万元
- 项目类别:合作创新研究团队
Understanding structural evolution of galaxies with machine learning
- 批准号:n/a
- 批准年份:2022
- 资助金额:10.0 万元
- 项目类别:省市级项目
煤矿安全人机混合群智感知任务的约束动态多目标Q-learning进化分配
- 批准号:
- 批准年份:2022
- 资助金额:30 万元
- 项目类别:青年科学基金项目
基于领弹失效考量的智能弹药编队短时在线Q-learning协同控制机理
- 批准号:62003314
- 批准年份:2020
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
集成上下文张量分解的e-learning资源推荐方法研究
- 批准号:61902016
- 批准年份:2019
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
具有时序迁移能力的Spiking-Transfer learning (脉冲-迁移学习)方法研究
- 批准号:61806040
- 批准年份:2018
- 资助金额:20.0 万元
- 项目类别:青年科学基金项目
基于Deep-learning的三江源区冰川监测动态识别技术研究
- 批准号:51769027
- 批准年份:2017
- 资助金额:38.0 万元
- 项目类别:地区科学基金项目
具有时序处理能力的Spiking-Deep Learning(脉冲深度学习)方法研究
- 批准号:61573081
- 批准年份:2015
- 资助金额:64.0 万元
- 项目类别:面上项目
基于有向超图的大型个性化e-learning学习过程模型的自动生成与优化
- 批准号:61572533
- 批准年份:2015
- 资助金额:66.0 万元
- 项目类别:面上项目
E-Learning中学习者情感补偿方法的研究
- 批准号:61402392
- 批准年份:2014
- 资助金额:26.0 万元
- 项目类别:青年科学基金项目
相似海外基金
Improving Heuristic Search by Machine Learning
通过机器学习改进启发式搜索
- 批准号:
RGPIN-2021-03205 - 财政年份:2022
- 资助金额:
$ 2.55万 - 项目类别:
Discovery Grants Program - Individual
Statistical mechanics of heuristic methods in multi-stage learning
多阶段学习中启发式方法的统计机制
- 批准号:
21K21310 - 财政年份:2021
- 资助金额:
$ 2.55万 - 项目类别:
Grant-in-Aid for Research Activity Start-up
Improving Heuristic Search by Machine Learning
通过机器学习改进启发式搜索
- 批准号:
RGPIN-2021-03205 - 财政年份:2021
- 资助金额:
$ 2.55万 - 项目类别:
Discovery Grants Program - Individual
Improving Heuristic Search by Machine Learning
通过机器学习改进启发式搜索
- 批准号:
DGECR-2021-00119 - 财政年份:2021
- 资助金额:
$ 2.55万 - 项目类别:
Discovery Launch Supplement
Exploration and Learning in Heuristic Search
启发式搜索中的探索和学习
- 批准号:
RGPIN-2020-04048 - 财政年份:2021
- 资助金额:
$ 2.55万 - 项目类别:
Discovery Grants Program - Individual
Exploration and Learning in Heuristic Search
启发式搜索中的探索和学习
- 批准号:
RGPIN-2020-04048 - 财政年份:2020
- 资助金额:
$ 2.55万 - 项目类别:
Discovery Grants Program - Individual
Machine learning and heuristic search
机器学习和启发式搜索
- 批准号:
46246-2007 - 财政年份:2011
- 资助金额:
$ 2.55万 - 项目类别:
Discovery Grants Program - Individual
Massively Parallelized Learning Real-time Heuristic Search
大规模并行学习实时启发式搜索
- 批准号:
393570-2010 - 财政年份:2010
- 资助金额:
$ 2.55万 - 项目类别:
Alexander Graham Bell Canada Graduate Scholarships - Master's
Machine learning and heuristic search
机器学习和启发式搜索
- 批准号:
46246-2007 - 财政年份:2010
- 资助金额:
$ 2.55万 - 项目类别:
Discovery Grants Program - Individual
Machine learning and heuristic search
机器学习和启发式搜索
- 批准号:
46246-2007 - 财政年份:2009
- 资助金额:
$ 2.55万 - 项目类别:
Discovery Grants Program - Individual